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Capitulo 1 
Introdução 


Sabe-se que os fenômenos que envolvem uma evolução em relação ao tempo são 
denominados sistemas dinâmicos. Geralmente, esses sistemas são expressos por 
um conjunto de equações diferenciais parciais, com condições de contorno e con- 
dições iniciais no tempo bem definidas, obtidas via princípio variacional de Ha- 
milton. 

Essencialmente, esse princípio reduz a formulação do sistema dinâmico em 
duas quantidades escalares. A primeira é a energia cinética (E,) e a segunda 
é o trabalho realizado (W) (que pode ser conservativo ou não conservativo), 
sendo ambas invariantes sob as transformações de coordenadas generalizadas. As 
equações diferenciais obtidas para descrever os fenômenos dinâmicos podem ser 
discretizadas no espaço, produzindo um conjunto de equações diferenciais ordi- 
nárias (EDO). Esse novo conjunto de EDO é resolvido na dimensão do tempo, 
podendo possuir ou não resolução analítica. Assim, um modo de resolução é uti- 
lizando algoritmos apropriados de integração numérica. Alguns exemplos desses 
algoritmos são o método de Euler, o método de Runge-Kutta etc. 

Os problemas que são descritos pelas EDO de movimento podem conter n 


graus de liberdade e são expressos da seguinte forma: 


d _ h(2(t);t) + Flt) + glt) (1.1) 


dt 
a(t) € R?” 


em que f é o vetor de forças internas (elétricas, magnéticas etc.) e g(t) é um 
vetor de carregamentos externos. Assim, se g = 0 o sistema é dito autônomo, 


ll 
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e se g +00 sistema é nao autônomo. Outra classificação envolve o cálculo do 
divergente da função h, que permite classificar os sistemas como conservativo ou 
dissipativo.! 

É importante ressaltar que a resolução de problemas nas mais diversas áreas 
da ciência, independentemente da sua especialidade, é definida pelas suas ca- 
racterísticas interdisciplinares, por meio de uma cooperação sistemática entre as 
partes: teórica (qualitativa) e experimental (quantitativa). 

Entretanto, deve-se prevenir os cientistas, independentemente de suas áreas 
de atuação, sobre as limitações das análises lineares, pois a descrição de fenôme- 
nos naturais ou tecnológicos possui uma extrema complexidade em virtude das 
inúmeras variáveis que os descrevem. Um exemplo são as análises de sistemas 
dinâmicos estruturais de uma plataforma de petróleo que é submetida ao impacto 


de ondas marítimas, que seguem uma não linearidade no seu movimento. 


Outros aspectos das não linearidades podem ser de origem elástica, inercial 
ou dissipativa e, geralmente, são aproximados por polinômios que contêm termos 
quadráticos ou de ordens superiores. Ressalta-se que, em estruturas sujeitas a 
grandes deslocamentos e pequenas deformações, geralmente apenas os efeitos da 
não linearidade geométrica são considerados. Um entendimento dessas caracteris- 
ticas dinâmicas é essencial para projetos de controle, que possibilitam analisar o 
tratamento das equações diferenciais não lineares, a fim de obter um sistema cujas 
amplitudes e fases dos modos vibracionais possuam deslocamentos desejados. Ou 
seja, determinar um processo no qual o sistema possua amplitudes vibracionais 
aceitáveis para não comprometer a estrutura. Por exemplo, as vibrações de uma 
ponte, que quando não controladas podem comprometer a sua estrutura e causar 
rompimento, 

Assim, é importante saber sobre o uso adequado das ferramentas que pos- 
sam servir para analisar os sistemas dinâmicos não lineares. No entanto, antes 
de efetuar tais análises, recomenda-se pesquisar as condições de equilíbrio do 
sistema, identificando os modos e as frequências naturais e verificando a exis- 
tência de ressonâncias internas e/ou externas, grandes deslocamentos, múltiplas 
soluções, pontos de bifurcação (em que a resposta sofre mudanças bruscas qua- 


litativamente), respostas com períodos diferentes ao da excitação, sensibilidade 


!A Equação (1.2) possibilita analisar a topologia da estrutura estudada por meio do mapa 
de Poincaré, que está associado ao retrato de fase gerado pelas equações. 
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às condições iniciais, ressonâncias super- e sub-harmônicas, que são alguns dos 
fenômenos presentes em sistemas não lineares. 

No entanto, a não linearidade dos sistemas dinâmicos gera alguns comporta- 
mentos interessantes, como o denominado comportamento caótico. As condições 
necessárias para a existência de movimento caótico são: o sistema deve ter pelo 
menos três variáveis dinâmicas independentes; e as equações diferenciais do mo- 
vimento devem conter um termo não linear que acople várias variáveis. Ou seja, 
a dinâmica do sistema torna-se caótica, sendo um fenômeno que obedece a leis 
determinísticas, mas cujo comportamento é imprevisível. 


Sabe-se que, para modelos determinísticos, condições iniciais idênticas levam a 
resultados idênticos, no entanto, em sistemas que apresentam um comportamento 
caótico isso não acontece. Uma possível explicação é considerar o determinismo 
no sentido forte da palavra, dessa maneira, as condições iniciais quase idênti- 
cas levariam a resultados quase idênticos. Por outro lado, em um sistema com 
comportamento caótico, o estado atual torna-se totalmente imprevisível após um 


determinado tempo. 


Com o passar dos anos, perguntou-se: como controlar o caos? Dessa forma, 
desenvolveram-se técnicas de eliminação do comportamento caótico do sistema 
dinâmico não linear a partir da introdução de um comportamento como se fosse 
periódico, isto é, técnicas que alteram o movimento do sistema dinâmico caótico 
para um sistema dinâmico periódico. Essas mudanças na trajetória de um sistema 
dinâmico caótico podem ser induzidas por pequenas perturbações, em virtude 
de a não linearidade nesses sistemas apresentar dependência com as condições 
iniciais. Assim, sem alterar a dinâmica do sistema, pode-se fazê-lo se comportar 
de maneiras distintas. Por outro lado, grandes perturbações que modifiquem a 
dinâmica do sistema alterarão substancialmente a trajetória original. Entretanto, 
em algumas situações, essas mudanças pode ser extremamente vantajosas, pois 
possibilitam que o sistema dinâmico caótico recaia o mais rápido possível para 
um determinado estado. 

Ressalta-se que os sistemas dinâmicos caóticos são mais flexíveis, em virtude 
da extrema facilidade de modificar a sua trajetória. Entre outras características, 
apresentam grande sensibilidade às perturbações nas suas condições iniciais ou 
nos seus parâmetros de controle. Isso significa que, muitas vezes, não basta dispor 
de uma ferramenta adequada para a sua análise, como um programa de computa- 
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dor avançado, é necessário que seu usuário investigue com critério as diversas res- 
postas quando as condições iniciais ou os parâmetros de controle são perturbados. 
Em outras palavras, é necessário investigar a estabilidade topológico-estrutural do 
sistema em questão. Além disso, os métodos numéricos utilizados são incondici- 
onalmente estáveis para a integração de sistemas dinâmicos lineares, no entanto, 


quando aplicados aos sistemas não lineares, podem perder a estabilidade. 


Além dos fatos apresentados, sabe-se que caos pode ser desejado ou inde- 
sejado, dependendo da aplicação de interesse. Por exemplo, em problemas de 
combustão, caos poderá ser desejável, pois o aumento da mistura de ar e de com- 
bustível poderá levar a um melhor desempenho da máquina em operação. Por 
outro lado, em aplicações de aerodinâmica ou de hidrodinâmica, caos gera tur- 
bulência e é indesejável, pois o aumento do arrasto dos veículos poderá elevar 
os custos operacionais. Em mecânica estrutural, caos poderá levar a operações 
irregulares e falhas por fadiga. Assim, o fenômeno caótico poderá ser restringido 


aos domínios de operação de muitos instrumentos eletrônicos e mecânicos. 


Portanto, devemos diagnosticar o comportamento caótico desses sistemas para 
determinar as regiões em que um determinado grupo de parâmetros possui o 
comportamento caótico e, assim, aplicar técnicas de controle que tornarão seu 
comportamento periódico. Um exemplo dos métodos que utilizamos para diag- 
nosticar esse comportamento é o diagrama de bifurcações, que mostra a dupli- 
cação de períodos e, consequentemente, a transição para o caos. Outra análise 
importante para a dinâmica caótica do sistema é o cálculo do espectro de Lya- 
punov, que, se for positivo, indica dependência sensitiva às condições iniciais e, 


portanto, comportamento caótico. 


Vários trabalhos vêm sendo desenvolvidos por diversos autores neste campo 
de dinâmica não linear e caos, e tem-se observado um grande desenvolvimento 
nesta área do conhecimento. Vale a pena ressaltar que a ocorrência desses fenô- 
menos em sistemas não lineares é visualizada mais facilmente quando uma análise 
paramétrica é realizada, pois isso possibilita a determinação de parâmetros que 
servirão como controle do sistema, geralmente adotando-se a amplitude ou a 
frequência de excitação como parâmetros de controle. Os demais parâmetros do 
sistema dinâmico são mantidos constantes, enquanto o parâmetro de controle é 
lentamente modificado. Isso fornece ao projetista um completo entendimento do 
que pode ocorrer com o sistema quando se varia determinado parâmetro. Se 
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algumas propriedades do sistema forem utilizadas como parâmetros de controle, 
pode-se encontrar uma faixa segura em que a excitação, ao variar, não provocará 


uma resposta caótica ou com grandes deslocamentos. 


Assim, essa análise paramétrica busca revelar a faixa de valores de determina- 
dos parâmetros do sistema que apresenta vibrações com amplitude excessiva ou 
sensibilidade às condições iniciais. De um modo bastante geral, obter a solução 
do sistema dinâmico é de suma importância, pois se verifica para quais valores 


dos parâmetros essa solução é estável ou não.? 


Seguindo essa linha de raciocínio, para um sistema modelado por meio de 
EDO não lineares dificilmente será possível obter uma solução exata, ou anali- 
tica. Geralmente, a única forma de obter as soluções é por meio de métodos 
numéricos, nos quais apenas respostas estáveis são obtidas, e algoritmos especi- 
ais devem ser usados para obter as trajetórias instáveis. Também, pode-se dizer 
que existem vários métodos aproximados para resolver equações não lineares que 
resultam em soluções analíticas aproximadas. Ressalta-se que, dispondo de uma 
solução analítica, a análise paramétrica torna-se mais simples e rápida. Dentre os 
métodos conhecidos para essas soluções aproximadas, destacam-se os de pertur- 
bações (balanço harmônico, método da média e método das múltiplas escalas). 
O objetivo deste capítulo foi apresentar alguns sistemas dinâmicos básicos não 
lineares, modelados matematicamente, com um número finito de graus de liber- 
dade, representados por equações diferenciais ou não. Supõe-se que as condições 
de existência, de diferenciabilidade e de prolongamento destas soluções sejam 
satisfeitas para os problemas expostos neste trabalho. 


Um esclarecimento: a modelagem matemática de sistemas dinâmicos tem 
como costume considerá-los como funções exclusivas do tempo, sem sofrer ação 
do movimento da estrutura excitada; esses modelos são denominados ideais. Em 


contrapartida, os modelos que consideram a vibração estrutural e da fonte de 


2A instabilidade de uma solução implica os fenômenos de bifurcação ou de escape. Nesta 
linha de previsão de escape ou de caos, o critério de Melnikov se destaca como uma importante 
teoria. Outra condição importante é aquela que considera o conjunto de soluções de uma equação 
diferencial, e não apenas sua parte de regime permanente. Deve-se focalizar a bacia de atração, 
e não só a cascata de bifurcações do regime permanente. Um sistema dinâmico também perde 
sua integridade quando a sua bacia se torna fractal, e não apenas quando ela desaparece ao se 
atingir o ponto crítico. É conhecido que, com as variações do parâmetro de controle, podem 
ocorrer três tipos de saltos (jump) na amplitude da solução: para soluções estáveis, soluções 
caóticas e soluções ilimitadas. 
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energia denominam-se modelos não ideias. Assim, o estudo dos modelos dinâmi- 


cos (ideais e não ideais) normalmente se desenvolve por três vias: 


(a) Propor a solução analítica ou por métodos de perturbação das equações 
do movimento obtidas de formulação lagrangiana para modelos de poucos 


graus de liberdade, com e sem os controles propostos. 


(b) Análise numérica de modelos de elementos finitos de grande porte, com e 
sem os controles propostos. 


(c) Instrumentação, medição de vibrações de estruturas existentes suportando 
fontes de vibração não ideais, com e sem os controles instalados, e trata- 
mento numérico de sinais. Obviamente, não se pode esquecer da impor- 
tância da teoria de controle no condicionamento das respostas dos sistemas 


dinâmicos quer eles sejam lineares ou não lineares. 


Para atingir esses objetivos, é importante definir o integrador do método nu- 
mérico, sendo os mais usados Runge Kutta e Previsor Corretor. Assim, passa-se 
ao estudo dos retratos de fase das variáveis dependentes, dos gráficos de recor- 
rência (RP) e das seções de Poincaré, que fornecem a topologia (geometria) dos 
fenômenos envolvidos. Uma análise mais qualitativa desses fenômenos é efetuada 
via cálculo dos expoentes de Lyapunov para a caracterização dos comportamen- 
tos regular (periódico e quasi-periódico) e irregular (caos) ou, mais recentemente, 
por meio do teste 0-1. Também pode ser efetuada análise de dados experimentais, 
isto é, quando não se conhecem as equações diferenciais que regem o fenômeno, 
utilizam-se técnicas de reconstrução do espaço de fase. 

Ressalta-se que muitas destas pesquisas têm gerado conhecimentos importan- 
tes para a área de mecânica teórica e aplicada. Por meio do uso de modelos 
matemáticos, têm sido identificados e explicados diversos fenômenos não linea- 
res. Dessa forma, definiremos algumas metodologias para modelar um sistema 
dinâmico. 


3É também de suma importância a determinação da estabilidade das soluções das equações do 
movimento obtidas. Normalmente, adota-se a definição de estabilidade segundo Lyapunov. Diz- 
se que um ponto de equilíbrio do sistema dinâmico é estável se, qualquer que seja a perturbação 
imposta ao estado de equilíbrio, o sistema permanece suficientemente próximo a esse estado; no 
caso oposto tem-se instabilidade. Se o sistema perturbado tender ao estado de equilíbrio inicial 
com o passar do tempo, diz-se que é assintoticamente estável. 
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1.1 Noções básicas de modelagem de sistemas eletro- 


mecânicos 


Sistemas eletromecânicos são aqueles que integram sistemas elétricos, mecânicos 
e de controle. Esses sistemas são classificados em três grupos: eletromecânicos 
convencionais (MACRO), microeletromecânicos (MEMS) e nanoeletromecânicos 
(NEMS). 

Os MEMS são sistemas cujos limites escalares mínimo e máximo são de 0,1 
um e 1 mm, respectivamente. Sabe-se que MEMS são constituídos essencialmente 
por mecanismos flexíveis, que se movimentam sem a junção de pinos e/ou juntas. 
No entanto, mecanismos flexíveis utilizam a propriedade de deformação como 
fonte de movimento. Dentre as principais vantagens desses mecanismos está o 
fato de serem construídos com uma única peça: a inexistência de problemas de 
folga devidos à montagem de pinos, resultando na ausência de lubrificação, e 
também de fadiga do material. 

A aplicação de mecanismos flexíveis em projetos de MEMS é quase 100%, já 
que, na microescala em que são fabricados, a presença de pinos e juntas torna 
a montagem difícil, senão impossível. Além disso, a presença de folgas não per- 
mitiria transmitir deslocamentos da ordem de nano a micrômetros gerados pelos 
MEMS. 

Os sistemas MEMS podem ser atuados de três formas: capacitiva, piezoelé- 
trica e eletrotermomecânica. Todas permitem que um MEMS seja atuado por 
meio da aplicação de um potencial elétrico. A atuação capacitiva apresenta a 
desvantagem da não linearidade entre a voltagem aplicada e o deslocamento ge- 
rado. A atuação piezelétrica tem as mesmas desvantagens do atuador capacitivo, 
além da dificuldade tecnológica de se depositar o material piezelétrico na escala 
do MEMS. Já a atuação eletrotermomecânica é muito utilizada nos MEMS, pois 
a existência de uma não linearidade entre a voltagem aplicada e o deslocamento 
gerado, e principalmente a facilidade de fabricação e o tempo de resposta é maior 
que as anteriores. 

Já os NEMS possuem limites escalares mínimo e máximo de 0,1 nm e 0,1 um, 
dessa forma, a sua visualização é por meio de microscópios especiais, por exemplo, 
o microscópio de força atômica ( Atomic Force Microscopes - AFM). É também de 
conhecimento geral que os fabricantes desses produtos têm trabalhando com base 
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em tentativa e erro, consumindo-se um tempo considerável e enorme quantidade 
de recursos financeiros para melhoria da resolução e do funcionamento desses 
microscópios. 

Assim, é necessário um investimento na interface do projeto de fabricação, 
fornecendo um ferramental matemático e de simulações numéricas para análise 
do comportamento dinâmico desses sistemas. Os modelos matemáticos propostos 
devem concordar com o comportamento físico e com os resultados experimentais 
obtidos pelos dispositivos de teste. As considerações para a modelagem são as 
características físicas como amortecimento, inércia, elasticidade e capacitância. 


Os MEMS operam em diversos domínios de energia, em particular nos do- 
mínios elétrico e elástico. Portanto, as simulações numéricas do comportamento 
desse tipo de mecanismo vincula as seguintes etapas: a análise elétrica, para de- 
terminar a distribuição de voltagem (tensão) no MEMS quando se aplica uma 
corrente elétrica, e a análise da deformação elástica gerada pela presença de car- 
gas térmicas, que eventualmente somam-se à análise térmica, para determinar a 
distribuição de temperatura devida ao efeito Joule. 


Na seção a seguir tratamos de dispositivos inerciais em virtude de sua extrema 
importância, pois são a base de dispositivos de geolocalização para aeronaves, de 
aviões comerciais até drones militares para reconhecimento de lugares. Outra 


aplicação são os automóveis autônomos. 


1.2 Dispositivos inerciais 


Os MEMS são microtransdutores que convertem energia elétrica em energia meca- 
nica ou vice-versa. Esses dispositivos, quando dispostos convenientemente como 
microssensores e microatuadores, integram relés, pinças, osciladores, filtros, trans- 


formadores, mixers, giroscópios, acelerômetros etc. 


Como são construídos por processos de fabricação por fotolitografia, é possi- 
vel a sua integração com dispositivos em um único chip, sendo seu baixo custo 
garantido pelas técnicas de processamento em pacote. A redução de dimensão 
desses dispositivos traz diversos benefícios, como: espaço e massa reduzidos, me- 
nor consumo de energia e redução de custo de fabricação. Entretanto, os custos 
de prototipagem são elevados, pois a obtenção dos parâmetros característicos do 
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MEMS é complexa, uma vez que as suas dimensões geométricas e as do ambiente 
em que operam são em escala micrométrica. 

Com isso, os sensores inerciais baseados em MEMS vêm substituindo alguns 
dos seus precursores, pois apresentam menores tamanho, peso, consumo de ener- 
gia e custo, e alta confiabilidade de operação, quando comparados com os sensores 
convencionais. A principal característica que ainda favorece os sensores conven- 
cionais é a precisão das medições, que ainda supera a obtida com os dispositivos 
MEMS, mas esta diferença vem se tornando cada vez menor. Ássim, apresenta- 
remos de forma resumida algumas características físicas para aplicarmos nesses 
dispositivos. 

Primeiramente, definiremos que a força F que atua em um corpo exercendo 
uma rotação é definida como: 


F =2mQ x V (1.2) 


em que m é a massa do corpo, V é o vetor de velocidade do corpo e Q é o vetor de 
velocidade angular do sistema. Essa aplicação de rotação é o movimento básico 
de giroscópios, com a força F proveniente do chamado efeito de Coriolis. 
Existem diversos tipos de estruturas mecânicas que aproveitam esse efeito. 
Um exemplo são os giroscópios tuning-fork, também denominados de tipo diapa- 
são, que contêm um par de massas que oscilam com mesma amplitude, mas em 
direções opostas. Quando essas massas são rotacionadas, a força de Coriolis cria 
uma vibração ortogonal que pode ser medida. O uso de duas massas de prova 
conjugadas na configuração citada permite ao giroscópio uma maior precisão na 
sua medida. Essa estrutura é muito conhecida por rejeitar os efeitos da acele- 
ração linear, em que ambas as massas se comportaram de modo idêntico. Esse 
problema é corrigido pelo modo diferencial da posição, em que esse efeito pode 
ser anulado. A operação diferencial também torna o dispositivo relativamente 


imune aos efeitos de vibrações externas. 


Capitulo 2 


Introdução aos sistemas 


dinâmicos 


2.1 Introdução 


Para dar início à modelagem matemática desses sistemas, nós precisamos deter- 
minar alguns princípios básicos para obter as equações diferenciais pertinentes 
ao sistema. Também precisamos determinar o princípio da mínima ação, mais 
conhecido como princípio de Hamilton, que estabelece o valor estacionário do 
sistema. Esse valor estacionário é atribuído à tendência das trajetórias no espaço 


de fase. 


2.2 Princípio da mínima ação 


O princípio da mínima ação estabelece que o sistema possui um valor estacionário 
(máximo, mínimo ou sela) para a trajetória que será efetivamente percorrida pelo 
sistema. Assim, vamos considerar o cálculo da distância entre o ponto A e o ponto 
B. Calcula-se a distância infinitesimal ds do comprimento infinitesimal da curva 


dada pela função y(x), sendo definida por: 


ds? = dz? + dy? (2.1) 
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Reescrevendo e integrando em relação a z e no intervalo [71,72] a Equação 


j f V1+ (2) ax (2.2) 


Como a = y', teremos: 


(2.1), teremos: 


ge J “Arruda (2.3) 


Assim, a equação é uma função de y(x), y(x) e x e, com isso, podemos 
considerar a Equação (2.3). Logo, teremos: 


= {i f(y(x), y (x), x)dx (2.4) 


Dessa forma, podemos maximizar ou minimizar a integral da Equação (2.4). A 
Figura 2.1 ilustra a trajetória descrita pela curva y(x), que minimiza ou maximiza 
a Equação (2.4). 

Vamos considerar a curva ĝ(x), que também pode minimizar ou maximizar a 
integral, Equação (2.1), como mostra a Figura 2.1. Definimos a função g(x), que 


descreve uma segunda trajetória, da seguinte forma: 
(x) = y(x) + ente) (2.5) 


em que £ € Re n(x) = n(x2) = 0. 


Por hipótese, quando £ = 0, a função da Equação 2.5 torna-se y(x) = y(x), que 
será a função que otimiza a integral da Equação (2.4). Dessa forma, a Equação 
(2.4) é uma função de e. 


(z) = 3 fly(x), y (x), x)dx (2.6) 
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Figura 2.1: Esquema para minimização da trajetória das partículas. 


Dessa forma, teremos que se £ = 0, a integral s possui um valor de máximo 
ou mínimo, o que implica que & também terá um máximo ou mínimo. Portanto, 


para determinar a otimização de s, utilizaremos: 


d®(x) 


= =0 (2.7) 


d y T2 
d(x) = [ HG + jan (a)| dx (2.8) 


Aplicando a integração por partes na segunda parcela da Equação (2.8), te- 


- E no) Ż (55) dx (2.9) 


zı 


remos: 


A Fait (a) = Sane) 


Ti 


Como n(xı) = n(x2) = 0, teremos: 


24 Sistemas dinâmicos e mecatrônicos, vol. 1 


E Doda = — L nla) (55) dr (2.10) 


Substituindo a Equação (2.10) na Equação (2.8), teremos: 


i) [oy ~ ae (ay) 2 ean 


Portanto, para que a integral definida pela Equação (2.11) se anule para 


qualquer valor de m(x), temos que: 
d (Of Of _ 
z (55) -5=0 (2.12) 


Dessa forma, nós definimos a equação de Euler-Lagrange. 


2.3 Método lagrangeano 


O método de Lagrange se baseia na Equação (2.12), que se constitui numa formu- 
lação alternativa para a segunda lei de Newton, dE = F, que relaciona a variação 
temporal do momento de um corpo à força F que atua sobre ele. Dessa forma, 


reescrevemos a equação de Euler-Lagrange: 


d/0L OL 
— | — } - — =0 2.13 
dt tà Og AN 
em que Llgu(t). qu(t)] é uma função escalar denominada função lagrangeana e 
(gx. qk) são as denominadas coordenadas e velocidades generalizadas, que são 


definidas como: 


qı (t), q2(t), -- -an (t) (2.14) 
ji (t), qo(t). ...s ån (t) 
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A função lagrangeana £ é definida como a diferença entre a energia cinética 


Ee e a energia potencial Ep: 


L=E-Ep (2.15) 


Assim, o movimento do corpo é expresso em termos de coordenadas generali- 


zadas qj, que se relacionam com as coordenadas cartesianas (x, y, Z) dessa forma: 


T= 2(qi, q2, qs. t) (2.16) 
p= 2(q1, 92, q3, t) 
z= T(q1, 92; q3: t) 


A tendência temporal nessas relações só existe quando há um movimento re- 
lativo entre os sistemas de coordenadas. Se ambos os sistemas sao fixos, então tal 
dependência temporal não existe. Exemplo disso é Alqm(t).t]. uma função esca- 
lar do tempo e das coordenadas generalizadas que produz exatamente a mesma 
dinâmica que a lagrangeana, 


Liam (i), imle) + Alden A (2.17) 


uma vez que a derivada total não altera a equação de Euler-Lagrange. 


É útil definir um conjunto de momentos canônicos conjugados, 


so (2.18) 


A Equação (2.18) mostra que o momento canônico é constante do movimento 
se a lagrangeana não depende explicitamente da correspondente coordenada ge- 
neralizada. Para essa metodologia, podemos definir a velocidade generalizada 
como: 


dy = SU (2.19) 
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Dessa forma, com a Equação 2.19, a enegia cinética Es pode ser reescrita da 


seguinte forma: 


m | (dx\? dy\? dz\? 
Assim, vale: 
E ES Ag (2.21) 
Co 2 ee at di 
=1 j=1 
em que 


ddr , dy dy , ds ds 
“da dq; =Oq~ OQ; dar da; 


(2.22) 


2.4 Método hamiltoniano 


Como vimos anteriormente, o método de Lagrange nos fornece equações diferen- 
ciais de segunda ordem para as variáveis dependentes q;. No entanto, no forma- 
lismo de Hamilton, as equações diferenciais são reescritas como duas equações 
diferenciais de primeira ordem. 

Antes de definirmos a equação de Hamilton, precisamos estabelecer algumas 
definições para melhor entendimento do leitor. Dessa forma, definiremos primei- 
ramente a transformada de Legendre. 

Seja f(x) diferenciável em relação às suas variáveis independentes. Assim, 
vamos admitir que desejamos encontrar uma função h(x) que possa ser expressa 


em termos de duda = a e que seja equivalente a f(x). Então, teremos que: 


a = 12) = he) 


- (2.23) 


Logo: 


h(z) = f(x) — ar (2.24) 
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A função h(x) é denominada transformada de Legendre de f(x). A transfor- 
mada de Legendre possui muitas aplicações, como na termodinâmica, área que 
tem por objetivo o estudo dos sistemas constituídos por infinitos entes físicos, ou 
seja, quando o número de moléculas tende ao infinito (N — 00). 


Considere que o momento generalizado p; seja definido pela velocidade gene- 
ralizada q;. Dessa forma: 


ðL 


Aplicando a transformada de Legendre, Equação 2.24, na equação de La- 
grange, teremos: 


L-9 pd; (2.26) 
j 


Assim, podemos definir a função hamiltoniana da seguinte forma: 


H(ğ, P.t) => jG — L(g, i,t) (2.27) 
j 


Então, obtemos a relação entre q e q, p, t a partir da definição generalizada. Logo, 


teremos: 


: . OL DE g OL 
dH =>. pjdá + 2 qjdp; — +d da - » ag, i -g (2.28) 
3 J J J 


Desse modo, utilizando as definições de momento generalizado, o primeiro e o 
quarto termos da Equação (2.28) se cancelam. Portanto, obtemos as denominadas 
equações canônicas de Hamilton: 


dq; OH 
a" in (2.29) 
dp; _ OH 
dt ðq; 
OH OL 
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2.4.1 Exemplo: vibração unidimensional da corda 


Na Figura 2.2, temos um exemplo de uma corda engastada e livre para oscilar 
verticalmente. 


| (B) F 


Figura 2.2: (A) Corda de tamanho L engastada nas duas extremidades. (B) Diferencial 
ds da corda e força de tração F. 


A Figura 2.2.B ilustra uma parte infinitesimal da corda de comprimento dz, 
com distância y do eixo x e com uma força de tração F. Considerando o princípio 


de Hamilton, temos: 
t2 
Az Ldt (2.30) 
Se 6A = 0, teremos: 


te 
64-5 / c=0 (2.31) 


tı 


Considerando a equação de Lagrange, £ = Ee — Ep, em que E, é a energia 
cinética no instante t, e Ep, a energia potencial na posição x e no tempo t, teremos 
que a energia cinética é definida por: 


E(x, t) = 5 me) [ue ae (2.32) 
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Com base na Figura 2.2.B, teremos: 


ds? = dy? + de? -. ds = \/ dy? + dx? 


dy = u(x,t) + t) vie, UE dy 


A variação do comprimento da corda é dada por: 


ðc = ds — dz 


Assim, substituindo na Equação (2.35) a Equação (2.34), teremos: 


r- ffi (EO) Jd 


Utilizando a expansão de Taylor na seguinte equação: 


MEI TE 


Substituindo a Equação (2.37) na Equação (2.38), teremos: 


de = ; ear 


Portanto, podemos descrever a energia potencial da seguinte forma: 


E,(2,t) = sf (Puta dx 
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(2.33) 


(2.34) 


(2.35) 


(2.36) 


(2.37) 


(2.38) 


(2.39) 
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Retomando a equação de Hamilton, Equação (2.30), e substituindo as equa- 
ções das energias potencial e cinética, teremos: 


= TA fi (nto (Ga) - p (UEI) ae (2.40) 


Considerando as condições de contorno y(x, tı) = 0 e dy(x, t2) = 0, 


id= 65 T f mtz) pie, -F Eu (2.41) 


Considerando u = m(x) SE ev = dy(x,t), integrando por partes o primeiro 


termo da Equação (2.41) e considerando as condições de contorno, teremos: 


š 2 
X mapa (eim ay Baim / i m(a) E syle, at (2.42) 


1 


Para o segundo termo, consideramos u = F (Se) ev = ĝy(x, t). Assim, 


C 82: $ 
f F (Me) y(x, t)dr 


Dessa forma, substituindo as Equações (2.42) e (2.44) na Equação (2.41): 


- -fF p (Ža y(a, t) t) = mlr) =H) dy (xr. t)dzdt (2.44) 
ti 
= F (He) syl, ) = ol, 


Assim, uma das soluções que satisfazem a equação anterior, originada pelo 


princípio de Hamilton, é dada por: 


Py(x,t) PUDE) _ 9 


F Jz? m(x) WP 


(2.45) 
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nF (263) q =0 (2.46) 


sendo öyle, t) = dy(C,t) — dy(0, t). 

Podemos observar que a Equação (2.45) é a equação de onda do sistema que 
descreverá o comportamento dinâmico da corda. Para uma análise mais profunda 
da função y(x.t), é necessário determiná-la. Uma das formas é pelo método de 
separação de variáveis. Então, vamos considerar que y(x.t) seja uma função 
contínua que depende do tempo t e da posição x. Desse modo, podemos escrever 


a função f(x,t) como o produto da parte espacial z(x) e da temporal f(t): 
y(x,t) = 2(x).f(t) (2.47) 


Dessa forma, as derivadas de segunda ordem são dadas por: 


Oy(z,t) _ d?z(x) 
da IO a a 
Oy(x,t d? f(t 

= = a(x) x 


Logo, substituindo juntamente com as derivadas na Equação (2.45), 


nates (2.49) 


d? z(x) å 
dt? 


PSS 


Dividindo essa equação por f(t).z(a), teremos: 


F @2(x) _ m(x) df(t) 
z(x) dx? — f(t) dt? 


(2.50) 


De maneira conveniente, tomaremos a constante de proporcionalidade cte = 


—w*. Assim, podemos reescrever a Equação (2.50) como: 


F dido) iFHO. 
m(x)z(x) dz? — f(t) df? mid Lael) 
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Dessa forma, teremos: 


Px) m(x)w? 
dx? F 


PIO pur fo) = 0 


ax) = 0 (2.52) 


2 — w?m(zx) à . e P 
Fazendo 5º = =F ~ e reescrevendo as equações anteriores, teremos: 


d?z(a) 


oo + B72z(z) = 0 (2.53) 
PID puro) = 0 


Ambas as equações possuem soluções analíticas da seguinte forma: 


f(t) 
SE) 


Reos(wt + À) (2.54) 
Cysen(8x) + Cacos(3x) 


Considerando as condições de contorno do sistema: 


OC) _ ,,0z(0) _ 


y(0,t) =0; 2(0) =0 


e também que 2(C’) = 0 e a corda não vibra, o que não satisfaz a solução do 
problema, teremos: 


sen(8C) = 0 (2.56) 


Para que a Equação (2.56) seja nula, teremos que satisfazer: 


AC=nr:C= a (2.57) 


Como: 
(2.58) 
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substituindo a Equação (2.58) na Equação (2.57), teremos: 


ern te 
cid m(x)C? 
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(2.59) 


em que n = 1, 2,3, ....Ou seja, a frequência natural de vibração da corda depende 


do comprimento da corda, da massa e da força de tração. A superposição das 


soluções fornece que: 


y(2,t) = > ensen(naa/L)encos(nra/L) 


m=1 


Com base na condição de ortogonalidade, teremos que: 


fey an f(z)sen (=) de 


sendo as frequências naturais da corda definidas como 


max 
E á 


(2.60) 


(2.61) 


Capitulo 3 


Métodos numéricos aplicados à 


dinâmica 


3.1 Introdução 


Neste capítulo apresentaremos o ferramental matemático e computacional uti- 
lizado na análise de sistemas dinâmicos não lineares constituídos por equações 
diferenciais. Em virtude da complexidade dos sistemas não lineares, faz-se ne- 
cessário caracterizar o comportamento global do sistema. Dessa forma, apresen- 
tamos a noção fundamental em teoria de sistemas dinâmicos que é o conceito de 
atrator. Começaremos com a definição de ponto fixo e ciclo limite, até chegarmos 
à obtenção das propriedades de atratores caóticos. A fim de descrever esses com- 
portamentos introduziremos as análises clássicas de espectro de frequência, mapa 
de Poincaré e expoentes de Lyapunov. Mapas de Poincaré permitem reduzir a 
dimensão de um sistema, enquanto expoentes de Lyapunov medem a divergência 
de trajetórias a partir de condições iniciais próximas. Além dessas ferramentas 
clássicas, apresentaremos uma nova ferramenta binária eficaz e confiável para 


testar se um sistema é caótico ou não, chamada de teste 0-1. 


3.2 Sistemas dinâmicos autônomos e não autônomos 


Um sistema dinâmico de ordem n é formado por n equações diferenciais autôno- 
mas de primeira ordem, definido como segue: 
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& = f(x), x(to) = xo (3.1) 


em que t = E, f: E > R”, é chamado de campo de vetores; E é um subconjunto 
de R”, r € E C R” e xp € E. O sistema de equações diferenciais na forma da 
Equação (3.1), em que f não depende explicitamente da variável independente t 
(usualmente t denota o tempo), é chamado de equação não autônoma; o tempo 


inicial ty pode ser tomado como to = 0. 


O termo solução do sistema da Equação (3.1) significa um mapa 4 : E > R”, 
em que ¢;(2) = @(t,x) é uma função contínua definida para todo z em E em 
algum intervalo 1 = (a,b) C R, tal que q(t, x) satisfaz a Equação (3.1) para todo 
t € I, isto é: 


d 
gê T) = Flt, 2)) (3.2) 


O mapa à, é chamado de fluxo gerado pelo campo vetorial f. Além disso, o 
conjunto de pontos @;(2,t) : J + R” é chamado de curva solução, trajetória ou 
órbita que passa pelo ponto £o. 

Considere agora o seguinte sistema de equações diferenciais ordinárias de pri- 
meira ordem: 


t= f(z, t), r(to) = £o (3.3) 


em que onde f : ExR > R”, a variável t é um escalar et € R. O sistema de equa- 
ções diferenciais na forma da Equação (3.3), em que f depende explicitamente de 
t, é chamado de equação não autônoma. Qualquer sistema não autônomo, Equa- 
ção (3.3), com x € E pode ser transformado em um sistema autônomo, Equação 


(3.1), com x € E x R” simplesmente considerando x,4; = t e za = 1. 


O conjunto E é chamado de espaço de fase. Na maioria dos casos, E = R”. 
Além disso, a dimensão do espaço de fase da Equação (3.1) é n (número de equa- 
ções diferenciais de primeira ordem do sistema). No caso da Equação (3.3), o 
espaço é (n + 1)-dimensional (E x R), em que a dimensão adicional corresponde 
a t, e frequentemente chamado de espaço de fase estendido. 
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Exemplo 1: Considere a equação do oscilador harmônico: 
t+r=0 


A equação é autônoma e, para determinar a equação vetorial correspondente, 
faremos x = 714, È = x2 para obter: 


4, = % 
To = -7 


Sabe-se que as soluções da equação escalar são combinações lineares de Acost 
e Bsent, em que 4,B € R são constantes que dependem das condições iniciais. 
As soluções podem ser projetadas sobre o plano x, x, que é chamado de plano de 
fase, e portanto é fácil verificar que, neste caso, o espaço de fase é E = R2. A 
Figura 3.1a mostra o plano de fase, enquanto a Figura 3.1b ilustra o plano de 
fase estendido (E = R? x R). 


Como observado, na Equação (3.1), o tempo não aparece explicitamente. Po- 
demos, dessa forma, realizar essa projeção para as soluções da equação autônoma 
geral, Equação (3.3). O espaço em que descrevemos o comportamento das variá- 
veis 71..... Zn. parametrizadas por t, é chamado de espaço de fase. 


A Equação (3.1), escrita em termos de componentes, torna-se: 


E = f(z), E ERIT y. (3.4) 


(a) (b) 


Figura 3.1: Solução (órbitas) do oscilador harmônico: (a) plano de fase e (b) plano de 
fase estendido. 
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Utilizaremos uma das componentes de x, por exemplo 74, como uma nova 
variável; isso requer que fi(x) # 0. Usando a regra da cadeia, obtemos (n — 1) 
equações: 


S 

II 
= 
O 


ER (3.5) 

As soluções da Equação (3.5) no plano de fase são chamadas de órbitas. O 
teorema de existência e unicidade de soluções aplicado a equações autônomas, 
Equações (3.1) e (3.5), diz que as órbitas no espaço de fase não se cruzam. Para 
obter a Equação (3.5), assumimos que fi(x) # 0. Se fi(xz) = Oe fo(x) £ 0, 
podemos tomar x como uma variável independente, e assim trocamos f(x) por 
falx). Se os zeros de fi(x) e fo(x) coincidem, podemos adotar x3 como variável 
independente etc. Em problemas reais essa construção é impossível no ponto 


T = (Ehe: n) tal que: 


fil) = fam) =... f,(2) =0 


Teorema 1. O ponto T e R em que f(T) = O é chamado de ponto fixo (ou ponto 
de equilíbrio) da Equação (3.1). 


3.3 Estabilidade local 


Podem-se encontrar na literatura de sistemas dinâmicos algumas definições para 
estabilidade. A que apresentaremos aqui é a definição de estabilidade segundo 
Lyapunov. 


Teorema 2. Seja @;(x) solução da Equação (3.1) definida para t > 0. Diz-se que 
dx) é Lyapunov estável se, dado um número pequeno € > 0, existir um número 
ó(e) > 0 tal que qualquer outra solução y(x) em que |ldo(x) — Wo(x)|| < 6 satisfaz 
|de(x) — ve(x)| < € para todo t > 0. Além disso, se dim. |oe(a) — (x)| = 0, 


então @,(x) é dito assintoticamente estável. 


A Figura 3.2 ilustra ambos os casos, ou seja, quando ó;(x) é estável (Figura 
3.2a) e quando ¢;(xz) é assintoticamente estável (Figura 3.2b). 
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Figura 3.2: (a) Solução estável e (b) solução assintoticamente estável. 


Além de verificar se a solução ¢;(a) da Equação (3.1) é estável ou não, também 
é possível caracterizar a estabilidade de pontos fixos. Portanto, apresentamos a 


seguir as principais definições relativas à estabilidade de ponto fixo. 


Teorema 3. Um ponto fixo T da Equação (3.1) é estável se, dado um número 
pequeno € > 0, existir um número (€) > 0 tal que, para toda condição inicial xo 
satisfazendo ||xo — Z|| < 6, tem-se ||@,(x9) — Z|| < € para todo t > 0. 


Teorema 4. Um ponto fixo T da Equação (3.1) é instável se ele não é estável. 
Teorema 5. O ponto fixo x = T da Equação (3.1) é chamado de atrator se existe 
uma vizinhança Ng C R” dex = T tal que x(to) E€ Ne implica lim a(t) =Z. Por 
x co 
outro lado, se o ponto fixo x = T tem esta propriedade quando lim x(t) = F, 
£-+—00 


então x = T é dito um repulsor. 


Teorema 6. O ponto fixo x =T da Equação (3.1) é assintoticamente estável se 


for estável e atrativo. 


Exemplo 2: Aqui vamos caracterizar a estabilidade de Lyapunov das solu- 
ções do seguinte sistema: 


dx 
dt 
dy 
dt 


A Figura 3.3 mostra o plano de fase e o campo de direções desse sistema, que pos- 
sui quatro pontos fixos, a saber: (0,0),(0.0,75).(1,0),(0,5,0,5), representados 
pelos pontos em vermelho na figura. Note que pelas definições 3-6, o único ponto 


e(l-2x-—y) 
y(0,75 — y — 0, 5x) 
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assintoticamente estável (atrator) do sistema é o ponto (0,5,0,5), pois quando 
t — +oo as soluções tendem a ele. Por outro lado, os outros pontos de equilíbrio 


são instáveis (repulsores), pois qualquer trajetória começando suficientemente 
próximas a eles se afastam deles quando t — +90. 


3.4 Soluções periódicas 


Teorema 7. Seja q(t.x) solução de um dado sistema dinâmico. Dizemos que 


essa solução é periódica com período mínimo T > 0 se, para todo t € R, 


o(t,z) = d(t+ T, x) (3.6) 


A] 
MY 

7 AM 
wk) 
AM 
| 


14 MASS 
ENA 


5 
4 


sm. 
ar 


- 


Figura 3.3: Plano de fase do Exemplo 2. 


Uma solução periódica é chamada de ciclo limite se existe uma vizinhança 
desta na qual não haja ponto pertencente a nenhuma outra órbita periódica. Em 


outras palavras, um ciclo limite é uma solução periódica isolada correspondendo 
a uma órbita fechada isolada no espaço de fase. 


Proposição 1. Seja y um ciclo limite. Se Q é uma vizinhança suficientemente 
pequena de +, então temos as seguintes possibilidades: 


1. y é estável se q E N => dim Iló(t, q) — yl] = 0. 


2. y é instável seq EQ > lim |ló(t,g) — 4]| = 0. 
t+—00 
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3. y é semiestável se q E€ Q, q exterior a y > Jim lota) — yl] = 0; dq EQ, 
oO 


q interior a y = Jim lót, gq) — 9] = 0, ou vice-versa. 
—>—o0 


Quando o caso 1 acontece, dizemos que o ciclo limite estável é um atrator 
periódico; por outro lado, no caso 2 diz-se que o ciclo limite instável é um repulsor. 
Quando se considera um espaço com duas dimensões, é possível mostrar que as 
órbitas de um sistema não linear movem-se (em espiral) em direção a uma curva 
fechada ou a um ciclo limite. 


Teorema 8. [Poincaré-Bendixon] Suponha que a órbita d(t,x) de um sistema 


autônomo (bidimensional), 
t= f(z) rE (3.7) 


permanece em um domínio compacto D C R2,vt > 0. Então, uma das seguintes 
afirmações é satisfeita: 

1. ġ(t,x) é uma solução periódica do sistema. 

2. ġ(t,x) tende em direção a uma solução periódica. 

3. ġ(t,x) tende em direção a um ponto fizo. 


[Critério de Bendixon) Se em um domínio compacto D C R? a expressão 


2 e 
Vey ni (3.8) 


não é identicamente nula ou não muda de sinal, então o sistema & = f(x) não 


tem nenhuma órbita periódica no interior de D. 


3.5 Soluções quasi-periódicas 


A solução de um sistema dinâmico composto por órbitas quasi-periódicas é carac- 
terizada por uma combinação de duas uma mais órbitas periódicas com frequên- 
cias incomensuráveis. A saber, duas frequências w; €e w são incomensuráveis se on 
resulta em um número irracional. Pode-se estender esse conceito para n frequên- 
cias, ou seja, dizemos que as n frequências, w1, w2,...,Wn, SÃO incomensuráveis 
se a equação 
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mato, + MW + ...MyWy, = 0 (3.9) 


é satisfeita somente quando cada um dos mi(i = 1,....n) é zero. 

Se a solução de um sistema dinâmico apresenta k frequências incomensuráveis, 
então a solução é chamada de solução quasi-periódica de período k. Uma órbita 
periódica com duas frequências incomensuráveis situa-se em um 2-toro T? = 
S! x S}, em que S! denota o círculo (que é muitas vezes referido como um 1-toro, 


T', gerado por cada uma das frequências), como ilustra a Figura 3.4. 


w., 


Figura 3.4: Comportamentos quasi-periódicos ocorrem sobre o toro S! x S}. 


3.6 Soluções caóticas 


Além de pontos fixos, órbitas periódicas e quasi-periódicas, sistemas dinâmi- 
cos podem apresentar órbitas irregulares confinadas que não se encaixam em 
nenhuma dessas categorias. Tais órbitas receberam o nome de caóticas. Uma 
definição formal de sistemas caóticos é fornecida por Devaney. As definições a 


seguir foram formuladas para mapas representados por uma função f. 


Teorema 9. [Definição de caos — Devaney] Seja V um conjunto. Um mapa 
continuo f : V — V é dito caótico em V se: 


1. f é topologicamente transitivo: para qualquer par de conjuntos não vazios 
U,W CV eriste k > 0 tal que f*(u) AW +). 


2. Os pontos periódicos de f são densos em V. 


3. f apresenta sensibilidade a condições iniciais: existe um 6 > O tal que, para 
qualquer x E€ V e qualquer vizinhança N de x, ha um y E N e umn > 0 
tal que |f"(x) — f”(y)| > ô. 
Ainda não há uma definição matematicamente rigorosa para o caos, embora a 
definição de Devaney seja a mais popular. Contudo, pode-se dizer que as seguintes 
características quase sempre são exibidas pelas soluções de sistemas caóticos: 
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1. Comportamento aperiódico (não periódico) a longo prazo. 
2. Sensibilidade às condições iniciais. 
3. Estrutura fractal. 


Exemplo 3: Considere o oscilador de Duffing: 


# + pa — z + Br? =Fcos(wt) (3.10) 


em que u, 3, F e w são todas constantes. Considerando u = 0,1, 8 = 1,0, 
F = 0,3425 ew = 1,4, pode-se ver na Figura 2.5 que a resposta do sistema mostra 
um comportamento aparentemente randômico. Esse tipo de comportamento pode 
ser classificado como caótico. Um exemplo de atrator estranho é encontrado na 
Figura 3.5b. Pelo que vimos anteriormente, esse sistema pode ser classificado 
como caótico pois apresenta sensibilidade a condições iniciais como mostra a 


Figura 2.6, isto é, as duas trajetórias que começam próximas divergem com o 


tt 


o 60 700 600 2 = A ws Q 
, = 


(a) (b) 


passar do tempo. 


ii | 


Figura 3.5: Comportamento caótico do oscilador de Duffing: (a) histórico no tempo e 
(b) plano de fase. 


In 
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| 
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Figura 3.6: Sensibilidade a condições iniciais considerando as condições iniciais 
(xo. 29) = (0,0) (preto) e (29,29) = (0,0001,0) (vermelho): (a) histórico no tempo 
e (b) plano de fase. 


3.7 Mapa de Poincaré 


O mapa de Poincaré é uma ferramenta clássica utilizada na análise de sistemas 
dinâmicos. A ideia principal dessa ferramenta desenvolvida por Henri Poincaré 
é transformar o fluxo de um sistema contínuo de ordem n em um mapa de or- 
dem (n — 1). A vantagem da utilização dessa transformação é ter um melhor 
entendimento da dinâmica global do sistema. 

Pode-se construir o mapa da Poincaré da seguinte maneira. Consideremos g 
o fluxo da Equação (3.1) e um conjunto de hipersuperfícies © = (Lm.m E Z} 
de dimensão (n — 1), cada uma delas transversal ao fluxo. Seja y uma trajetória 
do fluxo (a9) que cruza inúmeras vezes o conjunto X, de forma que um novo 
conjunto de pontos A, = {...,%j-1,2j,%i41,.-.} possa ser construído. O mapa 
P:5 55 tal que P(xi;) = ti+ı é chamado de mapa de Poincaré. 

Consideremos agora um sistema autônomo de ordem n dado pela Equação 
(3.3). Se o vetor f(x,t) nessa equação é periódico com período T com relação 
ao tempo, então a solução da Equação (3.3) tem um período que pode ser tanto 
um múltiplo ou um submúltiplo inteiro do período T. Dessa forma, esse período 
pode ser usado para construir uma seção de Poincaré. Esses planos, ou seções 
de Poincaré, são usados para construir um mapa estroboscópico do fluxo. Esse 
nome é dado porque tal mapa consiste em observar o sistema em tempos discretos. 
Neste caso, a seção de Poincaré pode ser definida como segue: 


2m(t = to) 


Ex f (2,0) E R" x S' | 0 = F 


rr. 2) | (3.11) 
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Começando no valor de tempo inicial t = tg e após cada período T, a órbita 
x(t) intercepta a seção de Poincaré © definida na Equação (3.11), como ilustra a 
Figura 3.7a, gerando uma coleção de pontos (em vermelho) sobre a seção de Poin- 
caré. Esse conjunto de pontos forma o mapa estroboscópico quando projetado no 


plano (x, x) (veja a Figura 2.7b). 


(b) 


Figura 3.7: Seção de Poincaré © de uma órbita de um sistema autônomo bidimensional 
com termos periódicos: (a) espaço (x, %,t) e (b) espaço de fase (x, x). 


Na Figura 3.8 é exibido o mapa estroboscópico para o oscilador de Duffing 
(Exemplo 3) considerando u = 0,1, 8 = 1,0, F = 0,3425 ew = 1,4. Esta 
seção de Poincaré mostra um comportamento caótico para o sistema, pois a 
órbita do sistema nunca voltará à mesma posição (x. à). O movimento ilustrado 
na Figura 3.8 apresenta uma variação complicada de pontos, o que é esperado 
para o movimento caótico. Nestes casos temos movimentos aperiódicos, o que é 
uma característica do caos determinístico. O oscilador de Duffing é um sistema 
dissipativo, pois V - f < 0, Equação (3.8), assim, em sistemas dissipativos há um 
conjunto de pontos (atratores) ou um ponto em que o movimento converge. Em 
sistemas caóticos, as trajetórias próximas no espaço de fase estão continuamente 
divergindo uma da outra seguindo o atrator (veja Figura 3.6). Por causa desses 
atratores, chamados de atratores estranhos ou caóticos, os movimentos no espaço 
de fase são necessariamente limitados. Os atratores criam padrões complexos, 
dobrando e esticando as trajetórias, e isso ocorre porque nenhuma trajetória se 
cruza no espaço de fase. 
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Figura 3.8: Atrator caótico da equação de Duffing tomando yu = 0,1, 8 = 1,0, F = 
0,3425 e w = 1,4. 


A seguir, apresentamos o algoritmo utilizado para obter o atrator caótico da 
Figura 3.8 considerando as seções de Poincaré. Note que este algoritmo é válido 
para qualquer sistema não autônomo com f(x,t) uma função periódica em t. 


Algoritmo 1: Mapa de Poincaré 

Entradas: valores dos parâmetros do sistema dinâmico ~ w: frequência da 
função harmônica; h: passo do integrador: xy: condição inicial; p: parâmetro para 
ajustar o valor de h (p € N); to: tempo inicial; tj: tempo final de integração; n: 
número de seções de Poincaré necessárias para construir o atrator. 

Saídas: pontos da seção de Poincaré. 

— 20 

1. Defina h = ia 

2. Defina t = [to : h : ty] 

3. Defina N como sendo o tamanho do vetor t 

4. for k de 0 para N faça 

5. —integrador(x,.); resultando £k — 244 

6. end for 

7. for i de 1 para n faça 


8. Ti=T (irp) 


9. end for 
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3.8 Expoentes de Lyapunov 


Como mencionado anteriormente, um sistema dinâmico não linear pode apresen- 
tar diferentes comportamentos dinâmicos, gerando dessa forma um rico cenário de 
soluções como: soluções oscilatórias isoladas (ciclos limites), quasi-periodicidade 
(soluções na superfície de toros) e caos (atratores estranhos). Uma forma de 
classificar esses comportamentos é por meio dos expoentes de Lyapunov, que 
fornecem informações de contração ou expansão de trajetórias próximas a seus 
respectivos atratores. O expoente de Lyapunov pode ser utilizado para avaliar a 
sensibilidade do sistema a condições iniciais. 

Aqui descreveremos o cálculo dos expoentes de Lyapunov da seguinte maneira: 
considere que duas condições iniciais próximas zı (to) e xa(to) de um dado sistema 
dinâmico estão localizadas dentro de uma esfera de raio 6, e que a distância 
entre elas é d(to), ou seja, {la (to) — xa(to)| = d(to), com d(to) < 6. Após um 
determinado instante de tempo t, esses dois pontos se moveram ao longo de suas 
respectivas trajetórias, de forma que a distância entres eles é d(t) (veja a Figura 
3.9). Então, a evolução dessas duas distâncias pode ser calculada como: 


di(t) = di(to)eMt-to) (3.12) 


em que i = 1,2,3,...,n. Para t tendendo ao infinito, A; converge para um valor 
limitado. Este valor A; é o que chamamos de expoentes de Lyapunov. 


Figura 3.9: Descrição do princípio dos expoentes de Lyapunov. 


De posse da Equação (3.12), vamos supor que, no instante to, o volume da 
hiperesfera é V (to) e que, para qualquer instante de tempo t > to, o volume V(t) 
é proporcional ao produto das distâncias d;(t), isto é, 


N 
V(t) x [] a(t) (3.13) 


i=1 
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Substituindo a Equação (3.13) na Equação (3.12), obtém-se: 


V(t) = V (toje l6- Dia A] (3.14) 


Em sistemas dissipativos, para que as soluções de um sistema dinâmico per- 
maneçam dentro de um espaço compacto, o efeito de contração do atrator deve 
se sobrepor ao efeito de expansão, ou seja, 


N 
SA <0 (3.15) 
t=1 


Por exemplo, para um sistema dissipativo no espaço do R$, obtém-se o se- 
guinte espectro de expoentes de Lyapunov: (Ay, A2,A3), com |As| > |A;|. Para 
tal sistema dinâmico ser caótico deve ocorrer que (+,0,—); um comportamento 
quasi-periódico (toro) acontece quando (0,0, —); e o comportamento periódico 
(ciclo limite) é obtido quando (0,—,—). Agora, apresentaremos a abordagem 
de Wolf para o cálculo dos expoentes de Lyapunov a partir do conhecimento do 
modelo matemático. 

Dado um sistema não autônomo N-dimensional, Equação (3.1), o cálculo dos 
expoentes de Lyapunov é feito verificando as divergências locais relativas a N 
vetores ortonormais dados por: 


{a1,Q@2,...,an} (3.16) 


Primeiramente, obtemos as equações linearizadas, que são dadas por: 


es = Ja t)P(x,t) (3.17) 


(zo) = M 


em que (r,t) representa a trajetória do sistema e ®(29) = M é a condição 
inicial, em que M representa a matriz de condições iniciais cujas colunas são 


os vetores @),Q2,...,a@y. Usualmente utiliza-se M = I, em que I é a matriz 
identidade e J (x,t) representa a matriz jacobiana de f(x,t), dada por: 
Of; (x,t) É 
Tyla, t) = AO EEE 1,25) (3.18) 


A proposta é integrar numericamente e de forma simultânea as Equações (3.1) 
e (3.17) por um período T e verificar a evolução dinâmica da Equação (3.1) no 
espaço de fase e da equação linearizada (3.17) no espaço tangente. Após a integra- 
ção neste período T, obtêm-se os próximos vetores divergentes (eixos principais da 


esfera da Figura 3.9) pela aplicação do mapa tangente (x,t), ou seja, o primeiro 
(0) 

expoente é a?) e A 0), com po = e em que o índice sobrescrito 

ay 
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denota a iteração atual. Se o processo iterativo de integração /normalização se 
repetir n vezes, então o primeiro expoente de Lyapunov é dado por: 


m 
A= in ct E tr (819) 
Em virtude da evolução temporal do sistema, este pode mudar de orienta- 
ção e, assim, os vetores 01,02,....Gn tendem a se alinhar com a direção mais 
expansiva do atrator. Por isso, emprega-se o processo de ortonormalização de 
Gram-Schmidt para gerar uma base em que a contribuição da direção com maior 
taxa de expansão local seja subtraída das demais direções, tornando possível o 


cálculo correto de Az até Aw. Assim, a partir dos vetores (a1,02,...,GN+, cons- 
truiremos o conjunto {v1, v2,- .., vn) dado por: 
ul) = Qj, 
(i) 
EF | L 
1 pç . 
(i) 
vi 
2 


lS us? 

(3.20) 
O = PP ul) a (PP ,) ul, 
tat 
NR S 


em que (-,-) é o produto interno. Na m-ésima iteração, a ortonormalização pro- 
duz N vetores w1,w2,...,Wy e, para m suficientemente grande, o expoente de 
Lyapunov é dado pela média: 


Ap = lim 2 3 In we? | ,com k=2,...,N. (3.21) 


m+ mt < 
i=l 


Apresentamos a seguir o algoritmo para o cálculo dos expoentes de Lyapunov 
baseado nas Equações (3.17) a (3.21). 
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Algoritmo 2: Expoente de Lyapunov 

Entradas: N: dimensão do sistema dinâmico; tg: tempo de evolução inicial; 
m: número de repetições para o cálculo do expoente de Lyapunov; T: tempo 
para a ortonormalização; h: passo do integrador; num: número de expoentes a 
ser calculado. 

Saídas: A: maior expoente de Lyapunov; Ag: segundo maior expoente de 
Lyapunov; ..., Aon-1: menor expoente de Lyapunov. 


1. Condições iniciais: z 


2. Condições iniciais para a equação linearizada: z' = (01,092,...,0N) 
3. for k de O para m faça 
4. for t de 0 para T faça 


5. integrador(x*); resultando zë — r*+! 


6. integrador(z*); resultando 2º — 2A+1 
7. end for 

8. for i de O para num faça 

9. A+=In(2') 

10. end for 

11. processo de ortonormalização(=”) 

12. end for 

13. for i de 0 para num faça 

14. A = A; 

15. end for 


Para ilustrar o cálculo dos expoentes de Lyapunov, utilizaremos o oscilador 
de Duffing dado pela Equação (3.10). Neste exemplo utilizam-se os valores de 
w=0,1, 8=1,0, F = 0,3425. Na Figura 3.104 tem-se a evolução temporal 
dos expoentes de Lyapunov considerando w = 0,8; neste caso o comportamento 
é periódico, pois encontramos dois expoentes de Lyapunov negativos. Por outro 
lado, na Figura 3.10b, a resposta mostra um comportamento caótico para w = 
1,4, pois encontramos um expoente de Lyapunov positivo. 
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Figura 3.10: Evolução temporal dos expoentes de Lyapunov: (a) comportamento pe- 
riódico e (b) comportamento caótico. 


3.9 Teste 0-1 


Recentemente, Gottwald e Melbourne propuseram um teste binário confiável e 
muito eficaz para distinguir se a dinâmica de um dado sistema é caótica ou regular, 
conhecido como teste 0-1. A ideia central do método é verificar as propriedades 
assintóticas da distância média quadrática entre duas funções. Essas funções 
exibem no plano um movimento difuso (como o movimento browniano) quando 
a dinâmica do sistema é caótica e um movimento não difuso quando a dinâmica 
é regular (periódica ou quasi-periódica). No caso de a dinâmica do sistema ser 
regular, a distância média quadrática é uma função limitada no tempo, por outro 
lado, se a dinâmica é caótica a função varia linearmente com o tempo. Portanto, 
a taxa de crescimento assintótica da distância média quadrática, K, assume dois 
valores: K = 0 para uma dinâmica regular e K = 1 para uma dinâmica caótica. 

Pode-se destacar como vantagem do teste 0-1 a sua aplicação direta na série 
temporal, não requerendo nenhum conhecimento das equações do sistema ou 
a reconstrução do espaço de fase. Isso torna o teste adequado para a análise 
de mapas discretos. equações diferenciais ordinárias, equações diferenciais com 
atraso, equações diferenciais parciais e séries temporais do mundo real. 

O teste pode ser empregado na análise da série temporal r(i)(i = 1,2,...,N), 
que representa algum dado observável do sistema dinâmico. Se a série de tempo 
discreta é proveniente de um sistema continuo no tempo, tem-se z(i) = P(t;) = 
d(idt), em que ĝt > 0 é o tempo de amostragem. Quando dt é muito pequeno 
o teste 0-1 pode levar a conclusões erradas, pois a série temporal é finita e a 
convergência de K torna-se muito lenta. Isso se deve a um problema de sobrea- 
mostragem, e para evitá-lo pode-se utilizar o método da informação mútua sobre 
a série temporal para definir a distância entre pontos consecutivos e, assim, definir 
ôt como igual ao valor do primeiro mínimo da informação mutual da série. 
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Para reduzir o esforço computacional, o teste 0-1 também pode ser aplicado 
considerando a série temporal de um conjunto adequado de pontos de Poincaré 
obtidos de uma dada trajetória. No entanto, a amostragem requer conhecimento 
prévio das escalas de tempo envolvidas no movimento, porém, em alguns casos, 
isso pode não estar à mão. 

Para verificar se o sistema é caótico ou não utilizando o teste 0-1, define-se uma 
extensão do sistema dinâmico caracterizada por duas variáveis adicionais, p(n, c) 
e q(n,c), que dependem do sistema dinâmico. Assim, Gottwald e Melbourne 
propuseram a seguinte definição: 


n 
p(n, c) = F x(i)cos(ic) 
a (3.22) 
q(n,c) = F, x(i)sen(ic) 
i=l 
em que c é uma constante, c € (0,7) en = 1,2,...,N. Os valores de p(n,c) e 
q(n,c) evoluem de acordo com a evolução temporal da variável observável x(7), 
fornecendo, portanto, informações sobre a resposta dinâmica do sistema. 

A teoria apresentada por Gottwald e Melbourne garante que se as funções 
p(n,c) e q(n,c) são limitadas, então o sistema apresenta um comportamento 
regular; por outro lado, se p(n,c) e q(n,c) apresentam um comportamento as- 
sintoticamente não limitado com um movimento browniano, a dinâmica é caó- 
tica. Portanto, para caracterizar o comportamento de um sistema dinâmico pelo 
teste 0-1, necessitamos encontrar um indicador capaz de mensurar se a dinâmica 
p(n,c) — q(n,c) é limitada ou não. O deslocamento quadrático médio M(n,c) 
pode ser utilizado como tal indicador, que definimos a seguir: 


N 
M(n,c) = im |, 5 E [ii +n,c) — p(i,n))? + (q(i+n,c) — qli, n))?| (3.23) 
i=1 


em que n << N ou n < Norte; COM Neorte << N. Na prática utiliza-se que 
Neorte = x. 

Após o cálculo do M(n,c) verifica-se se o sistema é regular ou não, no teste 
0-1, obtendo a taxa de crescimento assintótico K, do deslocamento quadrático 
médio M(n,c). A métrica K, é definida como: 


cou(€, M) 
/var(€) var(M) 
em que € = 1,2,...,n e M := (M(1,c), M(2,c),..., M(n,c)). Essa quantidade 


mede a força da correlação entre M(n,c) e o crescimento linear. Lembrando que, 
dados dois vetores x e y de mesmo tamanho (P), a covariância (cov(x,y)), a 


Ke = corr (€, M (€,c)) = (3.24) 
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variância (var(x)) e a média (7) são dados por: 


P 
cov(x,y) = xr —-T)(w-—UV), var(x)=cov(z,r), F= > E% zi (3.25) 
i=l 


Gottwald e Melbourne perceberam que para alguns valores de c no cálculo 
de Ke, pode ocorrer um fenômeno de ressonância, que faz com que Ke = 1 in- 
dependentemente de a dinâmica do sistema ser regular ou não, podendo ocorrer 
uma interpretação errada da dinâmica, especialmente se esta for regular. A fim 
de evitar esse erro, Gottwald e Melbourne sugerem repetir o cálculo de Ke di- 
versas vezes para um conjunto de Ne valores de c (em torno de 100 escolhidos 
aleatoriamente dentro desse conjunto) tomando o valor da constante c limitada 
ao intervalo c € E, Y . Portanto, o indicador (K) final da dinâmica do sistema 
é dado pelo cálculo da mediana dos Ne valores de Ke, ou seja, 


K = mediana(W) (3.26) 


com V = (Ke): Ko): roe KN]: 
Apresentamos a seguir o algoritmo do teste 0-1 para o cálculo da métrica K 
baseado nas Equações (3.22) a (3.26). 


Algoritmo 3: Teste 0-1 

Entradas: N: tamanho do vetor da série temporal; X(i)(i = 1,2,...,N): 
série temporal do sistema dinâmico; m: tamanho da série a ser analisada; Ncorte = 
N, € =1,2,...,n: vetor de crescimento linear. 

Saídas: K: indicador do comportamento do sistema dinâmico. 


1. Reorganize a série temporal com um tempo de amostragem adequado, 
por exemplo, pode ser utilizado o método da informação mútua, os pon- 
tos do mapa de Poincaré etc. Suponha que essa nova série é x(j) com 
§=1,2,.2.55%, 6R <P 


2. Defina um vetor aleatório c € (3. 3), com ¢ = {c},¢2,...,¢100} 
3. for k de 1 para 100 faga 


4. for n de 1 para Neorie faça 


5. Calcule os valores da funções p(n, c(k)) e g(n,c(k)) dados pela Equação 
(3.22) 


6. Calcule M(n,c(k)) pela Equação (3.23) 
7. end for 
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8. Calcule o valor da métrica Keç) = We 
y var var 


9. end for 
10. Calcule o indicador (K) como a mediana dos valores de Ke 


Agora, utilizaremos o teste 0-1 para determinar se o comportamento de um 
dado sistema é regular ou não. Vamos utilizar novamente a equação de Duffing 
dada no Exemplo 3, com p = 0,1, 8 = 1,0, F = 0,3425. A Figura 3.11 mostra 
o valor de Ke e a dinâmica das variáveis p(n, c) — q(n,c) para duas situações ilus- 
trando o comportamento regular e caótico do oscilador de Duffing. Nas Figuras 
3.lla-b, tomemos w = 0,8. A Figura 3.1la mostra a influência do parâmetro 
c na estimação de Ke. Note que neste caso os valores de K, estão distribuídos 
próximos a 0 e, dessa forma, a mediana desses valores de Ke fornecem o valor de 
K = 0 determinando, portanto, o comportamento é periódico. Na Figura 3.11b, 
é possível notar que a dinâmica das variáveis p(n, c) — q(n,c) tem uma curva fe- 
chada, caracterizando o movimento periódico. Por outro lado, tomando w = 1, 4, 
a Figura 2.11c mostra que os valores de K, estão distribuídos todos próximos a 
1. Além disso, quando o valor da métrica K = 1, a Figura 3.11d mostra que a 
dinâmica das variáveis p(n, c) — q(n.c) é irregular e ilimitada, confirmando que o 
oscilador apresenta um movimento caótico. Note que as conclusões apresentadas 
aqui são idênticas àquelas obtidas pelos expoentes de Lyapunov. 


3.10 Análise espectral — Fast Fourier Transform 


Um sistema dinâmico é representado pela variação temporal 1)(t) (série temporal) 
de suas variáveis dinâmicas. Se essa função u(t) é periódica (veja o Teorema 7), 
então ela pode ser representada como uma superposição de componentes perió- 
dicos. A determinação desses componentes é chamada de análise espectral, 
Como y(t) pode ser expressa como uma combinação linear de frequências de 
oscilações que sejam múltiplos inteiros de uma frequência básica de oscilações wo, 


então: 
oo 


w(t) = >. (a,cos(nwot) + bnsen(nwot)) (3.27) 
n=—%o 
wo 


E J “ (t)sen(nwpt) são constan- 


wo [ão 
em que a, = > [ °” w(t)cos(nugt) e bn = 
wo 


tes. 

A série dada pela Equação (3.27) é conhecida como série de Fourier. Por outro 
lado, quando u(t) não é periódica, ela pode ser expressa em termos de oscilações 
com frequências contínuas. Essa representação é chamada de transformada de 
Fourier de y(t). Neste caso, o espaçamento entre os componentes de frequência 


cr 
ct 
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Figura 3.11: Teste 0-1: (a) valor de Ke vs. c para w = 0,8, (b) dinâmica das variáveis 
p—q para w = 0,8, (c) valor de Ke vs. c para w = 1,4, (d) dinâmica das variáveis p — q 
para w = 1,4. 


torna-se infinitesimal e o espectro discreto de componentes de frequência torna-se 
contínuo. A transformada de Fourier a(w) da função y(t) é dada por: 


l _— tut ‘ 
a(w) = —— u(t)e™ (3.28) 
Vv 27 — 00 
e, na forma discreta, é dada como: 
1 N . 
ak ==> ne! (3.29) 
= 


Para implementação numérica a fim de caracterizar sistemas regulares ou 
não, existe uma versão da transformada discreta de Fourier conhecida como FFT 
(Fast Fourier Transform). A FFT é amplamente utilizada para analisar sinais 
experimentais, mas também pode ser usada em estudos de sistemas dinâmicos 
de baixa dimensão N, com N < 3, pois segundo o seu uso em sistemas em que 
N > 3 pode não ser muito vantajoso. 


56 Sistemas dinâmicos e mecatrônicos, vol. 1 


A fim de ilustrar a FFT para distinguir entre um sinal caótico e um sinal pe- 
riódico, utilizaremos novamente o oscilador de Duffing dado na Equação (3.10). 
Aqui consideremos como parâmetros pp = 0,1, 8 = 1,0, w = 1,4. Na Figura 
3.12a, utilizamos F = 0,1, e podemos observar que o espectro de frequências 
apresenta uma única frequência significativa, caracterizando o movimento perió- 
dico do oscilador. Já na Figura 3.12b, para F = 0,3425, a FFT mostra um 
espectro contínuo de frequências caracterizando a dinâmica caótica do oscilador. 
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Figura 3.12: FFT do oscilador de Duffing: (a) resposta periódica para F = 0,1, (b) 
resposta caótica para F = 0,3425. 


A seguir apresentamos o algoritmo (em MATLAB) para obter os espectro de 
frequências. 
Algoritmo 4: FFT 


Entradas: y: série temporal; F,: frequência de amostragem; L: tamanho da 
série temporal. 


Saídas: f: frequências; A: amplitude. 
1. Sugestão de comandos no MATLAB 
2. NFFT = 2“nextpow2(L); - tamanho da FFT, 
3. Y = fft(y,NFFT)/L; — calcula a FFT no MATLAB 
4. f = Fs/2*linspace(0,1,NFFT/2+1); — FFT é simétrica, jogue fora metade 
5. A = 2*abs(Y(1:NFFT/2+1)) — Tome a magnitude de FFT de Y 


6. plot(f*(2*pi),2*abs(Y (1:NFFT/2+1)),’k’) — plote em radianos 


3.11 Diagrama de bifurcação 


Até o momento vimos como caracterizar um determinado atrator para um pa- 
râmetro específico do sistema dinâmico. Um procedimento bastante interessante 
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é caracterizar o comportamento global do sistema quando variamos esse parâ- 
metro, chamado de parâmetro de controle. A mudança qualitativa do atrator 
com a variação do parâmetro de controle é chamada de bifurcação. O primeiro a 
usar o termo bifurcação foi Henri Poincaré para expressar a mudança qualitativa 
na estrutura de uma solução, como consequência da variação dos parâmetros do 
sistema. Essas mudanças estão intimamente ligadas a uma mudança do compor- 
tamento topológico do sistema. 

A fim de caracterizar essas mudanças qualitativas das órbitas para cada valor 
do parâmetro de controle, constrói-se o chamado diagrama de bifurcação. Uma 
das várias formas de construir tal diagrama é utilizar a distribuição estroboscópica 
da resposta do sistema. Dessa forma, estamos avaliando a resposta na seção 
de Poincaré para diferentes valores do parâmetro de controle. Para ilustrar o 
diagrama de bifurcação vamos utilizar novamente o oscilador de Duffing, Equação 
(3.10), com os seguintes parâmetros fixos: u = 0,25,3 = lew = 1, e vamos 
variar a amplitude do forçamento F. Para um determinado valor do parâmetro 
de controle F, o diagrama de bifurcação dado na Figura 3.13 mostra os valores 
assintóticos dos pontos de Poincaré da resposta do sistema x, em que o transiente 
é eliminado. 


Figura 3.13: Diagrama de bifurcação da resposta x em função de F. 


O espaço de fase da Equação (3.10) tem três dimensões, portanto, o sistema 
tem três expoentes de Lyapunov, um dos quais é sempre zero (na direção tangente 
ao fluxo). Para os dois expoentes restantes, se o expoente máximo de Lyapunov 
é menor que zero, então temos uma órbita periódica estável. Já para uma órbita 
quasi-periódica, o expoente máximo de Lyapunov é zero, enquanto para uma 
órbita caótica o expoente máximo de Lyapunov é maior que zero. 

A Figura 3.14a mostra os três expoentes de Lyapunov em função de F para o 
diagrama de bifurcação dado pela Figura 3.13a, calculado pelo algoritmo 2. Já a 
Figura 3.14b corresponde ao parâmetro K definido pelo teste 0-1 também para a 
variação de F, calculado utilizando o algoritmo 3. Note que há diferentes regiões 
de parâmetros F em que K = 0, o que corresponde a comportamentos regulares 
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(movimento periódico), enquanto há valores em que K = 1, correspondendo a 
soluções caóticas. Note que ambos os métodos apresentam uma convergência de 
respostas. 
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Figura 3.14: (a) Teste 0-1 (K) e (b) expoentes de Lyapunov (A) em função do parâmetro 
F. 


3.12 Bacia de atração 


Em geral, podem-se dividir os sistemas dinâmicos em dois tipos, a saber, con- 
servativos (hamiltonianos) e não conservativos. Os sistemas conservativos ou 
hamiltonianos têm a propriedade de preservar o volume no espaço de fase pela 
evolução no tempo. Isso significa que as trajetórias de todos os pontos inseridos 
em um subvolume óV no espaço de fase podem ser distorcidas com o tempo, mas 
o volume permanecerá constante. Já os chamados sistemas não conservativos ou 
dissipativos são de grande relevância para a descrição de fenômenos físicos. Es- 
ses sistemas têm a propriedade de que subvolumes arbitrários no espaço de fase 
tendem a zero quando t —+ +oo. Isso significa que os pontos convergem para 
um conjunto de dimensão inferior chamado de atrator, que possui volume zero 
no espaço de fase original. 

Contudo, nem todas as condições iniciais convergem, necessariamente, para 
o mesmo atrator. Se o sistema possui mais de um atrator, cada um deles possui 
uma bacia de atração própria. Matematicamente, definimos a bacia de atração 
do modo a seguir. 


Teorema 10. Sejam xo E€ U C R” um ponto de equilíbrio assintoticamente es- 
tável da Equação (3.1) ou da Equação (3.3) e (t,x) o fluxo gerado pelo campo 
vetorial f. A bacia de atração de xo, denotada por A(xo), é o conjunto: 


dias {2 EU: lim ¢(t,2) = xo} (3.30) 
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Em outras palavras, a bacia de atração de um atrator xo é o conjunto de 
todas as condições iniciais cujas órbitas convergem para xo. Conforme discutimos 
anteriormente, os atratores são essencialmente de dois tipos: os atratores que 
possuem uma forma geométrica simples, como um ponto fixo, uma curva fechada 
(ciclo limite) ou um toro; e a segunda classe de atratores, os chamados atratores 
irregulares ou "estranhos", que correspondem ao movimento caótico e possuem 
propriedades geométricas incomuns. 

O método mais simples para determinar as bacias de atração é a grade de 
integração de uma grade de pontos. Neste método, a bacia de atração é construída 
integrando-se numericamente as trajetórias da resposta de um sistema dinâmico 
em uma grade de condições iniciais. A duração das integrações numéricas deve 
ser tal que o comportamento transitório decaia suficientemente para permitir 
a identificação do estado estacionário da resposta resultante de cada condição 
inicial. 

A Figura 3.15a ilustra a bacia de atração do oscilador de Duffing para os 
seguintes parâmetros fixos: u = 0,25,8 = 1;w = 1 e considerando que F = 
0.02. Olhando novamente para a Figura 3.14, quando F = 0,02, o sistema 
apresenta um comportamento periódico. Para cada condição inicial dada no 
gride, obtemos o valor numérico da solução e a identificamos com uma das duas 
linhas correspondente na Figura 3.15b, portanto, representamos este atrator na 
Figura 3.15a como um ponto da mesma cor da solução encontrada. 
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Figura 3.15: Bacia de atração para (a) F = 0 e (b) F = 0,15. 


3.13 Gráficos de recorrência 


Uma das propriedades fundamentais dos sistemas dinâmicos é a sua característica 
de recorrência, pois o espaço de fase que descreve o sistema representa o seu 
comportamento e suas dimensões. Isto é, um ponto no espaço de fase define um 
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estado potencial do sistema que depende da função interativa e das condições 
iniciais. 

Para a construção dos gráficos de recorrência, necessita-se essencialmente da 
série temporal que é gerada por um experimento (natural ou artificial) ou por 
simulações computacionais, sendo um método eficaz para analisar essas séries 
temporais. Portanto, a construção de um gráfico de recorrência é bastante sim- 
ples, sendo baseada em um quadro que contém os elementos da série temporal 
sequencialmente dispostos do primeiro ao último, no qual a partir de valores pre- 
estabelecidos de dimensão de intervalos de medidas e distâncias, verifica-se se há 
ou não recorrência entre os valores. De um forma mais sucinta, os gráficos de 
recorrência têm a finalidade de visualizar a dinâmica de sistemas recorrentes. 

Assim, um gráfico de recorrência de uma série temporal de N termos consiste 
em uma matriz de dimensão N x N preenchida por pontos pretos e brancos, 
em que o ponto preto é denominado ponto recorrente e tem coordenadas (i,j) 
somente com probabilidade p(i, j) no instante do estado corrente (n = i) e no 
estado a ser comparado (n = j), com distância menor que ro, fixado no centro 
do estado recorrente. 

A definição mais utilizada para Rij é 


= O(rolyi — gill) (3.31) 
Yi E i ee eee. S 


em que N é o número de estados x; considerados, rg é o raio da vizinhança no 
ponto x;, ||.|| é a norma euclidiana, 9(.) é a função de Heaviside e m é a dimensão 
de imersão. 

Dessa forma, teremos que se A j = 1,0 estado é dito recorrente, o que gera um 
ponto preto no gráfico; caso R, 5 = 9, o estado não é recorrente, então é marcado 
um ponto branco no gráfico. A Figura 3.16 representa o comportamento de três 
funções temporais por meio dos gráficos de recorrência. 


3.13.1 Tipos de gráficos de recorrência 


Como há uma mudança topológica nos gráficos de recorrência, então podemos de- 
terminar duas categorias. À primeira é definida com o padrão de larga escala, que 
oferece uma visão global do gráfico e se divide em homogêneo, deriva, periódico e 
descontínuo. A estrutura homogênea apresenta pontos pequenos se comparados 
com o gráfico de recorrência como um todo, isto é, o tempo de duração de estados 
sucessivos é curto em relação ao tempo total de exposição do sistema. As estru- 
turas de deriva, no entanto, ocorrem quando o sistema possui uma variação de 
parâmetros lenta, que ocasiona uma ausência de pontos recorrentes. Em sistemas 
periódicos, as linhas do gráfico possuem diagonais paralelas à diagonal principal 
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Figura 3.16: Representação dos gráficos de recorrência: (A) série temporal aleatória, 
(B) função periódica y(t) = sin(t), (C) trecho da série temporal do sistema de Lorenz. 


e estruturas de blocos recorrentes, formando uma estrutura periódica no gráfico. 
Já em sistemas descontínuos, há mudanças abruptas na dinâmica, bem como a 
recorrência de eventos raros, ocasionando bandas brancas. 

A segunda categoria são os padrões de pequena escala, formados por pontos 
singulares, linhas verticais, diagonais e horizontais, e estruturas de blocos forma- 
das por essas linhas. Dessa forma, caso os pontos recorrentes estejam isolados, 
isso significa um estado raro no sistema. As diagonais ocorrem quando uma parte 
da trajetória evolui de forma paralela a outro segmento de trajetória, ou seja, a 
trajetória visita a mesma região. 


3.13.2 Quantificação de recorrência 


Com base na Figura 3.16, podemos observar que dependendo da série temporal 
há uma mudança na topologia dos gráficos de recorrência, assim, há a necessidade 
de medidas para quantificar a complexidade dos padrões formados. 

A primeira medida é a probabilidade de um estado ocorrer em um espaço de 
fase. Essa medida pode ser descrita pela equação: 


N 
1 
E = lm — is 3.3: 
Na ma De Ps (3.32) 


em que N é a recorrência que o sistema apresenta e Rj; são as recorrências 
possíveis. Os valores obtidos pela Equação (3.32) correspondem à taxa de pro- 
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babilidade de ocorrência no espaço de fase. Assim, se = for alto a probabilidade 
de ocorrência é alta, por outro lado, se = for baixo a probabilidade é baixa. 
Outra medida é o determinismo, sendo definido como: 


_ Een i) 
Diy Rij 


em que | é o tamanho da estrutura diagonal, P*(1) é probabilidade de essa estru- 
tura diagonal ocorrer dentro do gráfico de recorrência e lmin é O número mínimo 
de estruturas diagonais que se contabiliza dentro do gráfico de recorrência (o valor 
habitual é lin = 2). 

O determinismo é a quantificação de previsibilidade de cada gráfico. Vale 
prevenir que a medida não possui o significado de um processo determinístico, 
como é citado nos livros de dinâmica e mecânica clássicas. Ela se baseia nas 
evoluções similares da trajetória, e não em pontos intermitentes. 


D (3.33) 


A medida de entropia dos gráficos de recorrência fornece a frequência das 
linhas diagonais, sendo definida da seguinte forma: 


N 
S=- 535 pil)in[p(d)) (3.34) 
l=L,,im 
em que: 
a ce! (3.35) 
Dieting, PED) 


Dessa forma, a entropia fornecerá a mesma informação do comprimento médio 
menos um fator de escala, em virtude das multiplicações do logaritmo. Isso fica 
mais claro quando reescrevemos a entropia em função de L normalizado por todo 
o gráfico de recorrência: 


ANPR | JE 
iin PE(L) 


em que /; é um único comprimento normalizado. Dessa forma, podemos reescre- 
ver a entropia da seguinte forma: 


ly (3.36) 


N 
S=- Ý h(i) (3.37) 


l=lmin 


Ressalta-se que a única vantagem de relacionar o comprimento normalizado é 
fornecer um crescimento de comprimentos recorrentes em uma escala menor. 
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Outras medidas importantes para a análise dos gráficos são a laminaridade 
e o tempo de aprisionamento. A laminaridade é baseada nas linhas verticais e, 
de forma análoga ao determinismo, determina a razão entre as linhas verticais 
recorrentes de todo o gráfico de recorrência e o conjunto de pontos recorrentes 
contidos nele, sendo definida como: 


a PE(9 
DEE vP (v) 
Zo- UPF(!) 
em que Umin é o tamanho mínimo com que se deseja computar uma estrutura 


vertical. No entanto, se quisermos medir o tempo médio dos estados laminares, 
é utilizado o tempo de aprisionamento, definido como: 


La = (3.38) 


A OF (0) 
Tr = q 3.39 
F Pnn P*(1) 
Aplicando as definições no sistema de Lorenz dado pelas equações: 
da 
a = o(z2—7}) (3.40) 
dz» 
== (pr) 
dx 
> = 2122 — Bxr3 


Dessa forma, a Figura 3.17(A) e 3.17(B) representa o mapa de fase do atrator 
de Lorenz e seu grafico de recorréncia, respectivamente. 


Figura 3.17: (A) Representação do atrator de Lorenz para os parâmetros p = 28, 
a = 10 e 8 = 8/3 e (B) gráfico de recorrência do atrator de Lorenz. 


Por meio do grafico de recorréncia quantificamos as recorréncias que estao 
sumarizadas na tabela a seguir. 
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Tabela 3.1: Quantidades dos gráficos de recorrência 


Para as análises das medidas de quantificação e para a formação do gráfico de 
recorrência, foi utilizado o software Commandline Recurrence Plots, desenvolvido 
por Norbert Marwan e disponível em http: //www.recurrence-plot.tk /programmes.php. 


Capitulo 4 


Métodos analíticos 
aproximados 


4.1 Introdução 


Neste capítulo abordaremos métodos analíticos aproximados para resolução das 
equações diferenciais ordinárias não lineares que descrevem fenômenos nas mais 
diversas áreas. Uma maneira de obter tais soluções aproximadas é utilizando os 


métodos de perturbação que definiremos neste capítulo. 


4.2 Teoria de perturbação 


A teoria de perturbação é uma coleção de métodos iterativos para a obtenção de 
soluções analíticas aproximadas de problemas não lineares. O processo consiste 


nas seguintes etapas: 


e Converter o problema original em um problema de perturbação, por meio 


da introdução de um parâmetro pequeno, ¢ << 1. 
e Assumir a resposta na forma de uma série de potências em £ e x. 


e Substituir essa referida série na equação do problema, isolando os termos 


de mesma potência de £. 


e Determinar os coeficientes da série resolvendo as equações associadas aos 


termos de mesma potência de €. 
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e Escrever a resposta do problema em termos da série assintótica proposta. 


Assim, uma das grandes potencialidades do método consiste na sua capaci- 
dade de abordar equações diferenciais não lineares por meio de uma sucessão de 
equações, usualmente lineares, mais simples de resolver. Os métodos analíticos 
aproximados mais usuais são: método do balanço harmônico, método da média, 
método Linsdted-Poincaré, método das múltiplas escalas, entre outros (NAY- 
FEH, 1980). Neste capítulo, nos restringiremos ao método de perturbação e ao 
método de múltiplas escalas, por serem grandemente utilizados pela comunidade 
científica.! 


4.2.1 Método de perturbação 


Para definição do método de perturbação, consideraremos uma equação diferen- 
cial que descreva um processo dinâmico não linear e que possa ser escrita da 
seguinte forma: 

ii(t) +w u(t) + eg(t, u,t) =0 (4.1) 


em que u é a variável de projeto, t é o tempo, w é a frequência natural, g é uma 
função não linear, ¢ é um parâmetro que mede a ordem de grandeza do termo 
não linear e f é a força externa. Um fato interessante: quando £ = 0 a Equação 
(4.1) torna-se linear. 

Para o desenvolvimento do método de perturbação, vamos assumir que u(t) 
seja a solução da Equação (4.1) e possa ser expandida em série de potências em 
função de £, sendo expressa como: 


u(t,e) = uolt) + cult) + elualt) + --- +e" Utn(t) (4.2) 


'Por outro lado, citamos que os problemas de perturbação singular estão associados quando 
o parâmetro de perturbação vem multiplicando a derivada de ordem mais elevada na equação. 
Se o parâmetro de perturbação tende a zero, o termo de derivada de ordem superior fica de uma 
grandeza inferior aos outros termos da equação diferencial e, consequentemente, a tendência é 
desprezá-lo. Ao fazer isso, a equação diferencial não pode mais atender a todas as condições 
de contorno especificadas no problema original, portanto, o problema não pode ser resolvido. 
Do ponto de vista físico do problema, o surgimento de perturbações singulares está associado a 
regiões onde existe uma grande mudança no valor da variável dependente, caso típico de camadas 
limites. Para se obterem expansões uniformemente válidas, deve-se reconhecer e utilizar o fato 
de que nessas regiões existe uma grande mudança no valor da variável dependente. Essas regiões 
são caracterizadas por uma ampliação das escalas que se diferencia das escalas que caracterizam 
o comportamento da variável dependente fora delas. 
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em que wu; são variáveis a serem calculadas. Para £ = 0, a solução u(t,0) = uo 


corresponde à solução linear. 


Os termos em £ podem ser interpretados como perturbações em relação à 
solução ug. Dessa forma, como consideramos que u(t) é solução da Equação 
(4.1), então suas duas derivadas em relação ao tempo são: 


tu(t, €) = eùi (t) + e2ua(t) +- + eM tin (Ct) (4.3) 
ii(t,e) = cin(t) + e7tig(t) +--+ + ce" iin(t) 


Substituindo as Equações (4.2) e (4.3) na Equação (4.1) (diferencial) e agru- 
pando os termos em £, obtemos: 


[úo(t) + wZuo(t) — F(t)] + e [ita + wult) — gn(ito,u0,t)| + (4.4) 
+e? |ti2(t) + wult) + go(to, tt, uo, u1, t)] +--+ 
en tin (t) + wtin(t) + gn (tims tins. cos tp,» Un, 
+O(e"*1) = 0 


em que g; são funções não lineares independentes de e. 


Em certos casos, para obter g; é necessário substituir a função original não li- 
near por uma expansão truncada da série de Taylor. Os termos de ordem superior, 
representados por O (e"*'), são em geral desprezados, porque suas contribuições 
diminuem para e < 1. Como e não depende de u;, para que a Equação (4.4) seja 
válida sempre, cada termo de potência em e deve ser nulo: 


68 Sistemas dinâmicos e mecatrénicos, vol. 1 


Ordem 0 : iig(t) + wu (t) — f (t) =0 (4.5) 
Ordem 1 : ü (t) + w?uy (t) + gı (ùo, uo, t) = 0 
Ordem 2 : üə (t) + w ug (t) + ge (ŭo, ù1, uo. w1, t) = 0 


Ordem n : ün(t) + wtp (E) + gm (lo, da, +: «5 ini, U0, U1, ++ cs tin=1,8) = 0 


A Equação (4.1) foi substituída por um conjunto de (n+ 1) equações diferen- 
ciais, uma para cada variável u;. Para a equação de ordem i, os termos que não 
dependem de u; são transferidos para o lado direito da equação. Esses termos 


serão denominados carregamentos neste livro. 


Ordem O : tig (t) + wu (t) = f (t) (4.6) 
Ordem 1 : ity (t) + wu, (t) = -gı (ùo, uo, t) 
Ordem 2 : tig (t) + wug (t) = —go (tio, in, uo, u1, t) 


Ordem n : ün (t) + wun (t) = —gn (tio, t,..., uo, U1, ..., t) 


A primeira expressão da Equação (4.6) corresponde ao problema linearizado, 
cuja solução analítica é em geral conhecida. Note que as funções g;, que aparecem 
nos carregamentos, dependem das variáveis ù% e up para k = 0,1,....i— 1l, ou 
seja, dependem das soluções das equações anteriores. Portanto, as variáveis u; 
podem ser obtidas resolvendo-se sequencialmente as Equações (4.6), iniciando-se 


da primeira equação de ordem O até a última equação de ordem n. 


4.2.2 Exemplo de aplicação do método de perturbação 


Para exemplificar a técnica de perturbação, considere o problema de vibração 
livre do pêndulo simples, mostrado na Figura 4.1, cuja equação diferencial é 
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dada por: 

Ea é 

9 + sent) =0 (4.7) 


em que @ é o ângulo formado entre o pêndulo e a reta vertical, g é a aceleração 
da gravidade e | é o comprimento do pêndulo. 


(rs 


O 


nd 


Figura 4.1: Configuração pêndulo simples. 


Utilizando os dois primeiros termos da série de Taylor para a função seno, 
sen(0) = 0 — 08, a Equação (4.7) pode ser reescrita como: 


6(t) + w20(t) + ead?(t) = 0 (4.8) 


em que w? = fea = —hw?, O parâmetro € foi introduzido para identificar o 
termo não linear. A Equação (3.7) é conhecida como equação de Duffing. 


Considere uma aproximação de 8 com 4 termos na série de € : 


0 = Got) + e (t) + €700(t) + EBs(t) (4.9) 


Substituindo a Equação (3.8) na Equação (3.7) e agrupando os termos em e, 
teremos: 


[do + 28% | + € [a + wh + ab] + e [ds + w02 + 30630; | + (4.10) 
+ [és + ws + 30020» + 306062] + O(e*) =0 
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O conjunto de equações diferenciais é obtido anulando-se os termos de potên- 


cias em € e transferindo os carregamentos para o lado direito das equações: 


Ordem 0 

Ordem 1 6, + w20 

Ordem 2 : 02+w = —30626; 
Ordem 3 63 + w703 = —300202 ~ 300007 


do +w = 0 (4.11) 


— ab 


O número de termos presentes nos carregamentos cresce com a ordem i, o que 
aumenta o custo computacional para a solução de equações de ordem mais ele- 
vadas. 

Neste exemplo, se fosse adotada a restrição |9| < Amin, em que Onin é um 
ângulo pequeno, então não seria necessário utilizar € para solucionar o exemplo 
do pêndulo simples. Por outro lado, a introdução de e permite distinguir a ordem 
de grandeza dos termos de carregamento e, consequentemente, distribuí-los nas 
diversas equações diferenciais. Visto de outra forma, o parâmetro € serve como um 
artifício para rastrear a ordem de grandeza dos termos. Assim, após solucionar as 
Equações (4.11) e substituindo na Equação (4.9), teremos a solução aproximada 
que depende da ordem de £, ou seja, 


u(t,€) = cult) + eua(t) + --- +e" un(t) (4.12) 


4.2.3 Termos seculares 


O método de perturbação descrito anteriormente é um procedimento simples, 
pois as equações diferenciais geradas são lineares e possuem soluções analíticas. 
No entanto, o uso direto desta técnica é limitado pela lenta convergência da 
série em e. Em geral, são necessários muitos termos para alcançar uma precisão 
aceitável, principalmente se o intervalo de tempo de análise for grande. Como a 
complexidade das funções g; aumenta rapidamente com a ordem das equações, 
manter mais que dois ou três termos da série de € torna o processo ineficiente e 
pouco atrativo. 

A perda de precisão do método de perturbação é devida à presença de ter- 
mos no carregamento, conhecidos como termos seculares, cujas soluções crescem 
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infinitamente com o tempo. Por exemplo, considere que a equação de i—ésima 


ordem seja submetida a um carregamento harmônico: 


ii; (t) + wu; (t) = F cos Mt (4.13) 


em que F e Q são a amplitude e a frequência de excitação externa, respectiva- 
mente. O caso em que Q = w corresponde à condição de ressonância, dessa forma, 
podemos reescrever a equação anterior da seguinte forma: 


uu (E) = A sen wt + ug(0) cos wt + St sent (4.14) 


O último termo da Equação (4.14) possui amplitude ilimitada porque t pode 
crescer infinitamente. Substituindo u; na série de e, Equação (4.13), a aproxima- 
ção apresentará um termo contendo ¢'t. Enquanto et < 1, a contribuição desse 
termo na série estará limitada. Mas para valores de t mais elevados, esse termo 
assumirá valores de mesma ordem de grandeza da solução linear, violando a ideia 
de perturbação. A precisão da aproximação u passa a depender fortemente da 
precisão desse termo. Em geral, a aproximação é útil somente em um intervalo 


de tempo pequeno em que ét < 1. 


Os termos seculares podem ser identificados por meio da condição de resso- 
nância não amortecida, ou seja, quando a frequência da excitação externa é igual à 
frequência natural do sistema. Contudo, nem sempre é possível identificar direta- 
mente os termos seculares se o carregamento estiver na forma trigonométrica. Por 
exemplo, seja a função cos? wt. A verificação da frequência não é suficiente para 
determinar se o termo é secular, pela presença da potência cúbica. Mas, se a se- 
guinte identidade trigonométrica for utilizada: cos? (wt) = i cos (wt)+4 cos (3wt), 
entao nota-se que a parcela “cos (wt) é secular. 


Alternativamente, os carregamentos podem ser reescritos na forma exponen- 
cial por meio das relações: 
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e“! = cos(at) + isen(at) (4.15) 
elat + eitt 
cos (at) = ————_——__ 
(at) ; 
etat an e iat 
sen (at) = 
(at) 2i 


Substituindo a Equação (4.15) em cos? wt e expandindo o termo cúbico: 


iwt oil 1 f | é f 
cos? wt = (=) =5 Qi + 3e™* + 3e tt + aa! (4.16) 


Os termos eit ê Zeist sao seculares. Portanto, para encontrar os termos 
seculares basta avaliar diretamente os expoentes dos carregamentos na forma 
exponencial. 


Apesar da facilidade para encontrar os termos seculares, estes não podem ser 
removidos diretamente sem que haja, em geral, efeitos colaterais como a perda de 
precisão das aproximações. As técnicas que se baseiam nos métodos de pertur- 
bação utilizam estratégias mais sofisticadas para decompor os termos de carrega- 
mento, gerando novos termos seculares que possam ser eliminados com um menor 
impacto na qualidade das aproximações. Na próxima seção será apresentada uma 


dessas técnicas, o método de múltiplas escalas. 


4.3 Método de múltiplas escalas 


No método de múltiplas escalas (MME), assume-se que a variável u depende de 
várias escalas do tempo, de modo que: 


u(t,€) = u(To, Ti, Ta, ...,€) (4.17) 
em que: 


To =t; Ti=et; To=et; ...; Tra = dt (4.18) 
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A escala Ty, que corresponde ao próprio tempo t, é a escala mais rápida. 
Quanto maior o índice n, mais lenta é a escala. A Equação (4.1) (diferencial) 
apresenta duas derivadas totais no tempo: ù e ti, que devem ser substituídas por 


suas derivadas parciais por meio da regra da cadeia: 


x dT; O dh O 
z0- “dt et at ony) + at ay * eam) 
Para simplificar a notação, definiremos o operador derivada como: 
Ə 
D; = JT, (4.20) 


Utilizando a Equação (4.18) na Equação (4.19), a derivada primeira pode ser 
escrita como: 


2 
HO = Dol.) +D) + eD.) +O) = [Do + Di + D+ (STE) 
= [Ds +2eDoD; + É (Di + 2DoD2) + olè)] 


O conjunto de equações diferenciais é obtido seguindo o mesmo procedimento 
de pertubação apresentado anteriormente, salvo que as derivadas totais devem 
ser substituídas pelas derivadas parciais. No exemplo do pêndulo simples, se 
forem utilizadas 3 escalas de tempo u(t, e) = u(To, Tı, T2), as derivadas totais são 
substituídas por: 


6; = | D3 + 2eDoDi + e (D? + 2DoD2)| (4.22) 


Substituindo a Equação (4.22) na Equação (4.10): 


Dj + 2eDobo D100 + & (D300 + 2Do0o D200) + «760 + (4.23) 
+e [D301 + 2eDoDiy + & (Di0; +2D0D201) +470, + 65] + 

+ | D502 + 2eDoD10 + É (Dj 62 + 2D D202) + w*O2 + 300501 | + 
+0(&) = 
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Reorganizando os termos de potência em e: 


Dp ++ 1260] +e [DBO + w281 + a63 + 2DoD,o| (4.24) 
+e [D302 + 282 + 300804 + D30 + 2DoD200 + 2DoDi61| 
+0(&) = 0 


Finalmente, anulando os termos de cada potência em e e transferindo o car- 


regamento para o lado direito: 


Ordem 0 : Did +w =0 (4.25) 
Ordem 1 : D249 +w’ = —abê — 2 Do D100 
Ordem 2 : D362 +62 = —30028, — D$89 — 2Do D200 — 2Do D10 


As equações diferenciais ordinárias da Equação (4.11) foram substituídas por 
equações diferenciais parciais da Equação (4.25), o que aparentemente torna o 
problemas mais complexo. Apesar de as equações diferenciais envolverem múl- 
tiplas escalas, o lado esquerdo das Equações (4.25) contém somente derivadas 
na escala Tọ. Dessa forma, elas podem ser resolvidas como se fossem equações 
diferenciais ordinárias. A principal diferença entre as Equações (4.11) e (4.25) 
encontra-se no lado direito, ou seja, nos carregamentos. Os carregamentos pos- 
suem mais termos no MME que no método de perturbação direta. 


A presença de termos seculares é inerente aos métodos de perturbação, ocor- 
rendo também no MME. Em virtude da presença de mais termos nos carregamen- 
tos do MME, é possível normalmente escolher uma solução que não possua termos 
seculares. Isso é feito impondo-se a condição de que todos os termos seculares 
sejam nulos. Com a eliminação dos termos seculares, a solução aproximada pode 
ser aplicada em um intervalo de tempo mais longo, sem que haja a necessidade 
de utilizar ordens mais elevadas de aproximação. 
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4.4 Equações de modulação 


O sistema modelado? pode ser interpretado utilizando-se as equações de resposta 
em frequência. Por meio delas, é possível avaliar a influência dos diversos parâ- 
metros sobre as respostas do sistema e localizar possíveis comportamentos não 


lineares. 
4.4.1 Método de múltiplas escalas com múltiplos graus de liber- 


dade 


Nesta seção o MME será estendido para problemas com múltiplos graus de liber- 
dade. Considere: 


ity (t) +Hwtu()+eg(uut)-f(t) = 0 (4.26) 
tio(t) + weua(t) + egs(ùi ui, t) — fa(t) = 0 
ült) + wp u(t) + egi(ti, uit) — f(t) = 0 
em que m é o número de graus de liberdade e i = 1,2,...,m. Note que no 


problema linearizado, quando e = 0 , as variáveis u; estão desacopladas. Em 
geral utiliza-se uma transformação de variáveis modais para obter a forma da 
Equação (4.26). 


As expansões em série de € para as variáveis são dadas por: 
u(t, €) = ujo(t) + eui (t) + Pui a(t) +--+ + E uin(t) (4.27) 


em que w; são variáveis a serem calculadas, o primeiro indice i corresponde ao 
grau de liberdade, e o segundo índice, à ordem da aproximação. 

Substituindo a série de e e as derivadas totais pelas derivadas parciais na 
Equação (4.26) e anulando os termos de mesma potência de e, obtêm-se as equa- 
ções MME, que podem ser expressas como: 


? As equações de modulação fornecem relações entre as amplitudes e as fases das soluções 
aproximadas. Elas são obtidas anulando-se os termos seculares. As restrições geradas a partir 
das equações de modulação devem ser satisfeitas pelas soluções aproximadas, visto que tais 
restrições equivalem a atender à hipótese de que os termos seculares são nulos. 
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Ordem O: 
Dow o(t) +wiumo(t) = filt) (4.28) 
Dju2o(t) +wzu2o(t) = falt) 
Djumo(t) +wlumo(t) = fm(t) 

Ordem 1: 


Du (t) + wrur (t) —gı.1 (Deus, Dyuij, Ui j, t) (4.29) 


“i (Dini, Dki js tijt) 


Dita, (t) + wuz, (t) 
Diwanit tokt = —gmi (DẸRui j, Denis. tij, t) 


para i= 1, Zemi 1. 


Ordem 2: 


Diu a (t) + wun, (t) —g1,2 (Diu, Dyuij, tj, t) (4.30) 


—92,2 (Deus, Dki js tijs t) 


Diu,» (t) + wiu2 2 (t) 


Dum. (t) + wa uma (t) 


—Jm,2 (Djs, Dki js Wijs t) 


para i=1,2,---,mej <2. 
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Ordem n: 


Ditin (t) + WrUin (t) =—9in (Dinis Deus, Ui js t) (4.31) 


Dos n (t) +w3u2,n (t) = —92,n (Deus Dewig, tijs t) 
Ditinn (t) + We Umn (t) = = (Dêuij, Dyuij tijs t) 


para i = 1,2,---,mej<n. 


Alternativamente à Equação (4.27) pode-se utilizar a expansão: 


uj (t, €) = € u(t) +e? uilt) +... + uin(t) (4.32) 


4.4.2 Método de múltiplas escalas com múltiplos graus de liber- 
dade 


Neste caso, a Equação (4.26) deve ser ajustada para que as forças externas f; (t) 
sejam classificadas entre as equações MME. Por exemplo: 


ity (t) + wus (t) +egi(iust)-ef(t) = 0 (4.33) 
üz (t) + wou (t) + € g2 (ii, uit) —efo(t) = 
thm (t) + w? um (t) + € gm (Ùi, ui, t) — efm (t) = 0 


Substituindo a Equação (4.28) na Equação (4.29) e agrupando os termos de 
mesma potência de €: 
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Ordem 1: 
Dou (t) + wiu (t) = fi (t) (4.34) 
Dus: (t) +wzuz1 (t) = falt) 
Dõumo (t) +uwumo(t) = fm(t) 
Ordem 2: 


Dou, o (t) + w?u,2 (t) —91,2 (Dênis Dewis,uij,t) (4.35) 


—92,2 (Deus, Dui js tijs t) 


Dius » (t) + weur,2 (t) 


Ditm2 (t) + wi, tm,2 (t) —Im,2 (Diu; Dt js Uj, t) 


para i = 1,2,---,mej < 2. 


Ordem 3: 


Dius (t) + wus (t) = -91.3 (Diu, Dki j, Uig, t) (4.36) 


Diuz 3 (t) + w3u2,3 (t) —92,3 (Deus, Dki js tijs t) 


Dottm,3 (t)+wmuma(t) = —gm3 (Djuij, Ditis tijt) 


para ¿i = 1,2,- mej <3. 
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Ordem n: 


Dou n (t) + Wit n (t) — “Bly (Diu; Dru j, Ui js t) (4.37) 


Dito n (t) + w3U2,n (t) 


—92n (Diu, Dyttijs ist) 
Dum n (t) + Wi mo (t) = —Imn (Dêui js Dyuijs uij, t) 


para i = 1, 2,---,mej<n 
As variáveis u; j; podem ser armazenadas em um formato matricial como mos- 


tram as Tabelas 4.1 e 4.1. 


Tabela 4.1: Expansão em série de € a partir da ordem 0 


[Nível | Nivel? | Noela | [Niel NEn 
[Ordem 0 | Ordem 1 | Ordem 2 |.. | Ordem n 


Variável 1 Un 
Variável 2 U2n 
Variável m Umn 


3A primeira tabela corresponde à Equação (4.27), e a segunda, à Equação (4.30). As colunas 
das Tabelas 4.1 e 4.1 serão referenciadas neste livro como níveis. A primeira coluna corresponde 
ao nível 1, podendo conter a ordem 0 ou a ordem 1 dependendo da expansão da série de e 
adotada 
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4.4.3 Implementação do método de múltiplas escalas 


Os métodos de perturbação, incluindo o MME, são métodos algébricos de resolu- 
ção de equações diferenciais. As equações geradas por esses métodos podem ser 
bastante extensas, dependendo da ordem da aproximação adotada. 

Pra auxiliar a resolução desses problemas é apresentado o procedimento do 
MME é apresentado no fluxograma da Figura 4.2. As operações efetuadas em 


cada etapa deste procedimento são detalhadas a seguir: 


1. Definir o problema dinâmico: 


e Escrever as m equações de equilíbrio dinâmico do problema. 
e Classificar os termos não lineares utilizando o parâmetro e. 
e Selecionar o tipo de expansão de série de e (ordem 0 ou ordem 1). 


e Selecionar o número máximo N de níveis da aproximação. 
2. Gerar as equações MME: 


e Criar as escalas de tempo: To, MN... Tv. 
e Calcular as derivadas parciais para as escalas de tempo. 
e Criar as expansões de série de € para as variáveis w. 


e Substituir as derivadas totais pelas suas derivadas parciais nas equa- 


ções de equilíbrio dinâmico. 

e Substituir as variáveis pelas suas expansões de série de €. 

e Substituir a escala de tempo t = To. 

e Agrupar os termos de mesma potência em € e igualá-los a zero. 

e Passar os carregamentos para o lado direito da equação e obter as 
equações MME no formato das Equações (4.27) ou (4.30). 

3. Resolver as equações MME do nível 1: 

e Calcular as soluções homogêneas e particulares das equações MME 

para o nível 1. 


e Expressar as soluções no formato trigonométrico e no formato expo- 
nencial, utilizando a relação polar descrita na Equação (4.14). 
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4. Substituir as soluções anteriores nos carregamentos do nível j. 
5. Identificar e separar os termos seculares: 


e Os termos seculares possuem a mesma frequência natural da equação 
diferencial que está do lado esquerdo da equação MME. A identificação 
pode ser feita diretamente quando os termos são expressos na forma 
exponencial. Escrever as equações MME na forma exponencial, 


e Em certos casos, é necessário definir a frequência de interesse utili- 
zando o parâmetro de sintonia. Introduzir o parâmetro de sintonia 
para a frequência analisada. 


e Separar os termos seculares. 


e Remover os termos seculares dos carregamentos. 
6. Gerar as equações de modulação utilizando os termos seculares: 


e Reescrever a equação dos termos seculares na forma trigonométrica. 
e Separar a parte real e a parte imaginária da equação dos termos secu- 
lares. 


7. Gerar as equações de resposta em frequência 


e Introduzir a mudança de variável para equações autônomas. 
e Combinar as partes real e imaginária das equações de modulação em 
uma única equação de resposta em frequência. 


8. Resolver as equações MME do nível j sem os termos seculares: 


e Calcular as soluções particulares das equações MME para o nível j. 
Nesta etapa as soluções homogêneas não são necessárias, pois elas estão 
representadas na primeira aproximação no nível 1. 

e As aproximações u; ; devem atender às restrições para anular os termos 
seculares. Utilizar essas restrições quando aplicável. 
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9. Substituir as soluções na série de € e obter as aproximações para ti: 


e Escrever as equações na forma trigonométrica para facilitar o uso e a 


interpretação destas. 


e As aproximações u; devem atender às restrições para anular os termos 


seculares. Utilizar essas restrições quando aplicável. 


e Substituir as escalas de tempo pela variável t e eliminar o parâmetro 


e substituindo-o por e = 1. 


Algumas etapas do procedimento apresentado variam conforme o problema 
analisado. Tal fato torna a implementação computacional bastante complexa, 
caso este seja tratado como um todo. Em vez de tentar obter um programa de 
resolução geral, preferiu-se adotar a estratégia de implementar rotinas para a re- 
solução de partes do problema. Isso permite que o usuário faça as intervenções 
necessárias para cada tipo de problema. Apesar de as equações de resposta em 
frequência serem um subproduto do MME, é comum considerar que estas sejam 
mais importantes para a análise do comportamento do sistema no regime perma- 
nente. Neste caso, o procedimento pode ser interrompido antes de completar a 
resolução das aproximações. Na Figura 4.2 é indicado um segundo bloco de fim, 
em linhas tracejadas, após a geração das equações de resposta em frequência. 
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2) Gerar as Equações MME 
j=3 


3) Resolver as Equações MME do Nivel / 


não 


8) Resolver as Equações MME do „mennes i 7) Gerar as Equações de 
Nivel j sem os termos seculares : Resposta em Frequéncia 
' RS PER 
Ger > | ome 3 


Figura 4.2: Fluxograma do método de múltiplas escalas. 
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Capitulo 5 


Identificação paramétrica 


5.1 Introdução 


A metodologia proposta é para estimar os parâmetros constantes de um modelo 
previamente escolhidos por meio de dados experimentais. Normalmente, cada 
experimento é projetado para determinar os parâmetros do modelo estudado, o 
que significa que vários ensaios são necessários para caracterizar todos os parâme- 
tros desse modelo. Assim, as variáveis independentes do ensaio são, por exemplo, 
os graus de liberdade, as frequências do carregamento e as amplitudes do car- 
regamento, e as variáveis que serão medidas em ensaio são as amplitudes dos 
deslocamentos, estas geralmente decompostas por meio de análises espectrais, ou 


seja, pela análise do Fast Fourier Transform (FFT). 


Consideremos como exemplo um sistema com dois graus de liberdade, descrito 


pelas seguintes equações: 


; a OVN 

tiy + wp ey + pti + 5. = F(t) (5.1) 
1 

É . F OVNL 

us + weuy + ouso + Dus = F(t) 


em que u e u são as variáveis modais, | e [t2 são as constantes de amortecimento 
viscoso, F} e F são as forças externas modais e Vy, é a função potencial não 


linear. 
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Vamos considerar também o potencial nao linear, definido da seguinte forma: 


1 1 
VNL = gor + dguzug + du us + 3 at + (5.2) 
1 ‘ 1 f 1 
+ goi + agujuo + 5 aU U2 + amu + oun 


Assim, calculando as derivadas parciais em relação a u e up, teremos: 


OV 

= óu? + Wouy uz + ôgus + ad} + 3aquzug + aguyus + aqu (5.3) 
OVN 

a = dou? + 2d3u;u2 + dqus + a6? + aguíua + 3a4uzu2 + auž 


Substituindo as derivadas da Equação (5.3) nas Equações (5.1), obtemos um 
modelo com as não linearidades quadrática e cúbica: 


ür + wu + Qui +u? + 2őzuru + dguz + (5.4) 
+ au} + au? + 38aqu?u2 + azuru? + agus = Fi (t) 

üə + waus + Quota + dou? + 2óguyus + suz 
+ azu? + agzutuz — JaquZuy — asus = F(t) 


Os termos quadraticos e cúbicos são separados como ilustrado na tabela a 
seguir. 


Tabela 5.1: Parâmetros 


5.2 Identificação dos parâmetros 


A seguir, descreveremos a obtenção dos parâmetros da Tabela 5.1. 
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5.2.1 Parâmetro ô 


Para obter o parâmetro ĝ1, devemos excitar o modelo pelo seguinte carregamento 
sub-harmônico: 


F(t) 
F(t) 


2h cos(Qıt) (5.5) 
0 


em que Q = 2w. Logo, obtemos a solução no regime permanente para o método 
de múltiplas escalas (MME). As Equações (5.6) descrevem a solução do modelo 
da Equação (5.4): 


2fi 


ie acos [5t — >)] + SL cos(Mt) + (5.6) 
wy — Mi 
ô 
da nor [3 costae — v| +. 
"baat doa? 
u = =H Mt — — +... 
uz du? — a it- 7) — 22 + 


De uma certa forma, podemos eliminar os termos seculares, o que satisfaz a 


seguinte relação: 


252 
Sua? = X1 = soul — Qu) + af op - au (5.7) 
em que Sj; é uma constante que depende somente das frequências naturais e dos 
parâmetros do modelo. Assim, a amplitude de excitação fı é considerada uma 
variável independente e a variável dependente é a amplitude do deslocamento a. 
A Figura 5.1 ilustra o comportamento da variação da amplitude da resposta com 
a amplitude da excitação. 

Podemos observar na Figura 5.1 que há dois saltos, ¢; e ¢2. O primeiro salto 
é caracterizado fazendo a = 0 e fı = 0, em que obtemos: 


G a 


1 
G2 — 982 =um + gri (A — Zn)? (5.8) 


Já o segundo salto é determinado por: 
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4 


o + 4 + + 
O O15 02 O25 03 035 04 045 OF 055 06 
f 


Figura 5.1: Variação da amplitude de resposta com a amplitude de excitação. 


f2ô 1/2 
free: yy = si = 0 (5.9) 
i= G 


Assim, podemos obter a seguinte equação: 


wip (QF E w?) 


a= i] 


(5.10) 


Logo, medindo o valor de € ou GG é possível calcular a norma de 6; por 
meio das Equações (5.9) ou (5.10), contudo, o sinal do parâmetro 6; não pode 
ser obtido por essas equações. Então, o sinal de 6; que está relacionado com a 
componente de drift pode ser determinado considerando as Equações (5.1), pois 


suas soluções não possuem termos que variam com o tempo, desse forma: 


u = acos ad viaiaa (5.11) 
JUR E ata 
2 
= oe edad a aa" 


2(4w? — w3) 
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Nota-se que os termos = e = contêm 6; e do. Além disso, o sinal desses 
termos depende somente do sinal de 6; e d2. As componentes de drift podem ser 
medidas utilizando-se análise espectral. Elas correspondem às amplitudes de u1 
e u2 para a frequência nula, ou seja, que não varia com o tempo. 


5.2.2 Parâmetro ô» 


Para estimar o parâmetro 594, o modelo é excitado pelo seguinte carregamento 


sub-harmônico: 


F; (t) 0 (5.12) 
F(t) = 2fcos(Mt) 


As soluções no regime permanente para este problema, obtidas pelo método 


de perturbação, são dadas por: 


uy = acos E (Qət — n+ 33 dint aE cos(Mat — y) — | +... (5.13) 
_ č% he 502 
us = we — we we cos(Qet) + 2(4w? — we) cos(Qot ses y) = 23 +. 


Para eliminar os termos seculares, a seguinte relação deve ser satisfeita: 


Su nen E Bint | ED coil (5.14) 
11 2 1 2 W1 (03 — w3)? Uy pty s 


De forma análoga, a Equação (5.7) é uma constante que depende somente das 
frequências naturais e dos parâmetros do modelo. A amplitude de excitação fo é 
considerada uma variável independente, e a amplitude de deslocamento a, uma 
variável dependente. Então, recorremos à Figura 5.2. 

Como no caso anterior, a Figura 5.2 possui dois saltos. Assim, podemos 
caracterizá-los considerando a = 0, fo = @ e 


C353 


1 
(w2 pA 02) = wi + grilh — 2u P (5.15) 
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G 
Ol O15 02 025 03 O35 04 045 OF 055 06 
f 


Figura 5.2: Variação da amplitude de resposta com a amplitude de excitação. 


O segundo salto é definido pelo ponto: 


fie 2.2 
agp ita = 0 


fh = 4 


Dessa forma, obtemos Q, que é descrito pela seguinte equação: 


wip (03 — w3) 
¢ = See 
[52] 


(5.16) 


(5.17) 


Medindo os valores de 4 e C2 é possível calcular a norma de 62 por meio das 


Equações (5.16) e (5.17). No entanto, como para dy, o sinal de 462 não pode ser 


obtido pelas equações anteriores. Portanto, de forma análoga ao dj, para obter o 


sinal de d> devemos medir a componente de drift. 


5.2.3 Parâmetro a; 


Com a obtenção dos parâmetros 6; e 69, o parâmetro a, pode ser obtido da 


seguinte forma: 


e Escolher um dos experimentos anteriores e medir a amplitude a por análise 


espectral. Por exemplo, no segundo experimento, a é a amplitude de u; 


para a frequência de Sa, 


e Calcular a constante Sı, da Equação (5.14). 
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e Calcular a; pela Equação (5.7). 


5.2.4 Parâmetro a» 


Para estimar o parâmetro «9, o modelo deve ser excitado pelo seguinte carrega- 


mento sub-harmônico: 


F(t) 
F(t) 


0 (5.18) 
2 f2 cos(Nst) 


Il 


em que Mo = 3w. 
A solução no regime permanente para o problema é obtida pelo método de 
pertubação e dada por: 


Qt = dia? [1 Mht — 2 
u = arcos ( E Da [zoe (E) - 1] he... (5.19) 
A 2 2 2 ) 52a? + 40443 
ug = 2Aegcos(Qet) + X rm = wu) cos ( at 37 202 + 


em que As = a 
wi- 
Para eliminar os termos seculares, a seguinte relação deve ser satisfeita: 


E E f | i 1 a Ap 
wy + py + zw (N2 — 3w) — 2º — Sye”| = 16 (5.20) 
em que: 
4669 4663 26:62 26963 
a eka. . ação À pra = P ge 4 See) ED 
the an) * Moma a tee TO OY 


852.43 45242 


= ake i ee ic S 
Sı = 2a3A3 + OB — dea? + (p+ un)? ak (5.22) 
453 A3 — 466345 4620345 
(No -w)? -w3 wA w3 


Dessa forma, para obter o parâmetro as, devemos seguir os seguintes passos: 
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e Calcular Sı utilizando os parâmetros anteriormente calculados (01, 02, 03, 


a4, 23) e a Equação (5.22). 


e Obter a amplitude a por meio de análise espectral, que corresponde à am- 


plitude de wu; para a frequência de 1/39. 
e Calcular o valor de A. 


e Calcular a9. 


5.2.5 Parâmetro a; 


Para estimar o parâmetro a3, o modelo deve ser excitado pelo seguinte carrega- 


mento sub-harmônico: 


Fi(t) = 2fi cos(Qyt) (5.23) 
F(t) = 2fo cos(Not) 


em que Qı = 2w e NM = 2wa. 
Dessa forma, a solução no regime permanente para este problema, obtida pelo 


método de perturbação, é dada por: 


a} Cos f (Qit— 71 )| + +o cos(Qut) +. (5.24) 


ui 


pa -iE cos(ut =y) -1| +.. 


2 fo 
us = a2cos J (Qt — | - ie cos(Nat) 


= Tla cos(Qet — y2) — i] +.. 


Para o parâmetro ag, teremos de eliminar os termos seculares, em que as 


seguintes relações deyem ser satisfeitas: 


a X1 522 — X2Si2 
Sm Sa — São 

E e X2S11 — X1S12 
2 $1182 — 83, 


(5.25) 
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em que: 
853 852 46103 Adod4 


Dessa forma, as amplitudes de a; e a2 devem ser obtidas por análise espectral 
dos deslocamentos de u1 e ug. Logo depois, avaliar o valor de S41 e, finalmente, 


calcular ag. 


5.2.6 Parâmetro a; 


De forma análoga aos demais parâmetros, estimaremos os valores de «4 conside- 


rando o seguinte carregamento sub-harmônico: 


= 

pm, 
~= 

— 
| 


2 fı cos(Qit) (5.27) 
Pit) = 0 


Dessa forma, obtemos as seguintes soluções para o regime permanente para 


este problema, obtida pelo método de perturbação, dada pelas seguintes equações: 


o dga?2 2Mt — 27 63a + 46) Aj 
uy = 2A; cos(Qyt) + Nau? 7 2) ( 3 ) er + (5.28) 
a = ac (=) Sa gg (HEB). 


Para eliminação dos termos seculares, a seguinte relação deve ser satisfeita: 


em que A; = zim 


1 1 1 
wau + Few _ 3w2) — 22 mi Sea?) = to Na? (5.29) 
em que: 
z 45364 46963 20304 20203 
x * 191(91 — 209) © (M1 — we) — we 3w? = dw — ws? (5.30) 
863 463 465 40109 
o = Macs T - -—— ss o S eee 
z M a a a a qd 
46904 
= 2 


wa 
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Assim, para obter o parâmetro ay, devemos executar os seguintes itens: 


e Calcular S utilizando os parâmetros anteriormente calculados na Equação 
(5.30). 


e Obter a amplitude a por análise espectral, que corresponde à amplitude de 


uz para a frequência de 1/30. 
e Calcular A. 


e Calcular au. 


5.2.7 Parâmetros 63,6; e ds 


Os parâmetros 63, 64 e a5 são calculados de forma análoga a ô}, d2 e 6), logo: 


ug — Uy (5.31) 
we — Wy 
b4 > 6, 
ô3 — de 


As —+ O 


Dessa forma, teremos: 


1062 452 252 
ES = Rite = que ot a 5.32 
22 5 E we + tak = wat ( ) 


em que: 
Soa? = Xo (5.33) 


5.2.8 Resumo dos experimentos 


A escolha do modelo é uma etapa crítica do procedimento. Caso o modelo não 
contenha os elementos que capturam o comportamento físico do sistema, o mo- 
delo ajustado fornecerá previsões imprecisas. Como o modelo escolhido contém 
não linearidades quadráticas e cúbicas, para verificar a existência destas foram 
aplicadas excitações externas sub-harmônicas (1/2 e 1/3) das frequências naturais 
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principais. À ordem dos experimentos também é importante, visto que alguns 
parâmetros são dependentes de outros. No entanto, alguns resultados analíticos 
expostos nessa subseção estão explicitados no volume dois desse livro. 


5.2.9 Sistema de Duffing sem e com amortecimento 


Como exemplo, exploraremos primeiramente o sistema de Duffing sem amorteci- 


mento, descrito pela equação: 
- - APEN r PO 2913 rn 
&+w*a2 = e(—w ar — w Br? + F cos(Nt)) (5.34) 


em que € € (0,1) é o parâmetro de ordem de grandeza, œ é a perturbação da 
mola linear, 3 é o parâmetro da não linearidade da mola e F cos(Nt) é a excitação 
harmônica. 


Assim, para que equação de primeira ordem possua solução periódica, os 
termos seculares devem ser anulados, condição obtida quando: 
3 er 
w = wo + -web AS — — (5.35) 
4 Apo 
em que wọ é a frequência natural do sistema linearizado. Em virtude da singula- 
ridade de Ap que ocorre em 0, devemos separar o gráfico em duas partes, Ay < 0 
e Ag > 0. Dessa forma, variando os parâmetros £ĝ e £F e calculando | Ao| para 
obtenção dos valores positivos, obtemos a Figura 5.3 para diferentes valores de 


ep. 
Já as equações de Duffing com amortecimento são descritas como: 
“ - NA Ra, A ee 
t+w'z=e(-w'az—w'Ba” — cx + Fcos(Nt)) (5.36) 


em que c é o coeficiente de amortecimento viscoso, £ € (0.1), a é perturbação da 
mola linear, 5 é o parâmetro da não linearidade da mola e F cos(Qt) é a excitação 
harmônica. 
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A B 
10 (A) ’ Ud —— (B) 
9 9 
8 8 
7 7 
Es — 6 
S Ss 
5 5 
És <3 
3 3 
2 2 
1 1 
0 0 
w Ww 
C D 
6 (C) 6 (D) 
5 5 
4 4 
<3 <3 
2 2 
l l 
0 n 0 
E Nor i= Za as 3 0 05 1 15 2 25 3 
w w 


Figura 5.3: Curvas de níveis |Ag| e w = 1. Sistema sem amortecimento: (A) 8 = 0,1 
e (B) 8 = 0,2. Sistema com amortecimento: (C) £8 = —0,05 e (D) =8 = —0, 1. 


Neste caso, a condição para que os termos seculares sejam nulos é: 


w? = we + TugenA? — = cos(ġo) (5.37) 
0 


a sin(do) — exw = 0 


em que ģp é o ângulo de fase do carregamento da equação de primeira ordem. 


Note que, se c = 0, então: 


sin(ġo) 
Po 
cos(ġo) 


(5.38) 


II 
en 


Dessa forma, as equações seculares do sistema amortecido equivalem ao sistema 
não amortecido. 
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Podemos eliminar ġo isolando os termos de seno e cosseno nas Equações (5.37) 


e utilizando a identidade trigonométrica cos?(@) + cos?(@) = 1, então: 


(328 AZuwê — 4w? + 4w2)?A2 (ec) Agw? 


IEF) (ery! mamn 


A equação anterior é um polinômio do 4° grau em w e do 6° em Ag. Portanto, 
mudar a variável permite reduzir a ordem desses polinômios para 2° e 3° graus, 


respectivamente. Logo, como y = A? e x = w?, teremos: 


(3eBywe — 4a + 4wg)y 4 (ec) ys _ 
16(eF)? (eF) 


1 (5.40) 


Assim, os valores de importância são os de w positivo, bem como as raízes de Ag. 
O gráfico é apresentado a seguir: 


10 
9+ J 
8+ — e F20 J 
——t = 
Tf = = E F=4 | 
6 
< 5 ‘ ] 
4 É - 
3 1 
2+ 4 
It 
0 + 4 4 4 4. hee =] 
0 0.5 1 1.5 2 25 3 


Figura 5.4: Curvas de níveis |Ap| e wo = 1. 


Dessa forma, podemos verificar as seguintes propriedades: 


e Uma raiz real e duas raízes imaginárias. É o caso por exemplo de uma reta 
vertical w = cte que intercepta uma única curva. 


e Todas as raízes são reais. É o caso da reta vertical w = cte. Todas as três 
curvas são interceptadas. 
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e Quando a reta vertical tangencia as curvas, ocorre uma degeneração e temos 
somente dois pontos de intersecção em vez de três. O ponto tangente é um 
ponto instável. 


5.3 Saltos 


Na passagem de baixas frequências para altas encontra-se o denominado ponto 
(A) instável. Se em A a frequência for aumentada, ocorre o denominado salto 
para o ponto B, que corresponde à configuração estável mais próxima. Assim, 
teremos que a Figura 5.5 representa o salto para valores de £F = 0,=F =2e 
eF =4. 


eBh=Otecc=O2eF =4 


Figura 5.5: Curva representando o salto do ponto A para o ponto B. 


No entanto, podemos observar o salto no sentido contrário, ou seja, partindo 
de frequências altas para as mais baixas. Seja o ponto € um ponto instável (de 
alta frequência). Se nesse ponto a frequência for reduzida, ocorre um salto no 
ponto D, que corresponde à configuração estável mais próxima. A Figura 5.6 
representa um exemplo desse tipo de salto. 
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cBb=01,cc=02cF=4 


Figura 5.6: Curva representando o salto do ponto C para o ponto D. 


Portanto, no sistema não amortecido, as amplitudes tendem a infinito nas 
proximidades da frequência de ressonância. Na presença de amortecimento, as 
amplitudes são limitadas, tendo um valor finito. Os dois trechos em torno da 
parábola (£F = 0) se unem formando uma única curva. A mola não linear faz 
com que o pico de ressonância se curve para um lado. Se a mola é rígida (3 > 0), 
o pico vai para a direita. Se a mola é macia (3 < 0), o pico vai para a esquerda. 
Esse encurvamento possibilita que mais de duas posições de equilíbrio estejam 
disponíveis para uma mesma frequência. Tal fato não ocorre quando a mola é 
linear e o pico é reto, ou seja, é interceptado uma única vez. No fenômeno de 
salto, ocorre uma mudança brusca na configuração que parte de um ponto instável 
para outro estável, ambos vizinhos de uma frequência crítica. 


Capitulo 6 


Fundamentos de controle 


6.1 Sistemas dinâmicos lineares 


Neste capítulo trataremos de técnicas de controle automático de sistemas diná- 
micos. De forma geral, o controle automático visa garantir a estabilidade e o 
desempenho, de acordo com as especificações. 

Um sistema pode ser definido como um conjunto de dispositivos que intera- 
gem com um determinado objetivo. Por exemplo, uma espaçonave é construída 
a partir de uma grande quantidade de dispositivos que interagem com o obje- 
tivo de fazê-la se deslocar no espaço. Assim, uma espaçonave é um sistema. A 
partir dessa definição, podem ser estudados diversos tipos de fenômenos físicos, 
químicos, biológicos, sociais, ou outros. 

Para estudar o comportamento de dado sistema devemos definir suas fron- 
teiras, de modo que tudo o que estiver no interior destas seja parte do sistema. 
Por exemplo, o sistema © (Figura 6.1) se relaciona com o mundo exterior à sua 
fronteira a partir de suas entradas u; e saídas y;. 

O sistema da Figura 6.1 tem m entradas e n saídas. Um sistema com essa 
característica é chamado de multivariável ou MIMO, acrônimo para Multiple In- 
put Multiple Output. Por outro lado, se possui uma única entrada e uma única 
saída, o sistema é chamado de monovariável ou SISO, do inglês Single Input Single 
Output. Neste capítulo trataremos apenas do último caso. 

Uma característica importante dos sistemas de controle reside no fato de se- 
rem sistemas dinâmicos. Um sistema dinâmico é aquele cujos estados evoluem 
ao longo do tempo. Os sistemas dinâmicos são descritos matematicamente por 
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uy mn 
uz Y2 
Um Un 


Figura 6.1: Entradas e saidas de um dado sistema. 


equações diferenciais (ED), ou seja, o sistema da Figura 6.1 pode ser descrito 
pela seguinte equação diferencial ordinária (EDO): 


E (t v(e) WEGE) ul" (8) u(t)) =0 (6.1) 


que estabelece para o sistema X(t) uma relação entre a entrada u(t) e a saída 


y(t), determinando a sua evolução temporal. 


Outra característica importante a ser considerada refere-se à invariância tem- 
poral. Em sistemas invariantes no tempo, os coeficientes da equação são todos 
constantes e não existe dependência explícita do tempo t. Assim, a Equação 6.1 
pode ser reescrita sem a dependência temporal explícita: 


E (y(t), w(t), (8), + sul (8) u(t)) =0 (6.2) 


De forma geral, os sistemas encontrados em processos industriais, robótica, 
aeronaves, sistemas eletromecânicos, circuitos elétricos, entre outros, são lineares 
apenas de forma aproximada. Contudo, mesmo se considerados aproximadamente 
lineares esses sistemas podem ser controlados, apresentando comportamento es- 
tável e atendendo aos requisitos de desempenho utilizando as técnicas de controle 
clássico. 


Sistemas lineares compõem um subconjunto importante na análise do com- 
portamento e do controle de sistemas dinâmicos. De fato, as técnicas clássicas de 
projeto de sistemas de controle são baseadas nas técnicas de análise de sistemas 
dinâmicos lineares. Por isso, a seguir é apresentada a definição de sistema linear. 
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Um sistema E é dito linear se para toda entrada uy que gera uma saída 
yı = E(u), e para toda entrada uz que gera uma saída ys = E(ua), o principio 
da superposição for válido, ou seja: 


y = E(ciu + coua) = c1X(u1) + coh (ue) = cry + coye (6.3) 


para cy, cz números reais ou complexos. Assim, se yı e y2 forem linearmente 


independentes, formam uma base do espaço de soluções de E. 


6.2 A transformada de Laplace 


À transformada de Laplace é uma das técnicas utilizadas para a análise e a solução 
das EDO lineares e invariantes no tempo, com algumas vantagens em relação às 
técnicas tradicionais de solução para esse tipo de sistema. 

A partir da transformada de Laplace obtém-se sempre, em uma única ope- 
ração, a solução geral de sistemas lineares, ao contrário das técnicas tradicionais 
que demandam diversas operações. Além disso, a transformada de Laplace troca 
uma equação diferencial por uma equação algébrica na variável complexa s. Por 
meio de manipulações algébricas obtém-se a solução no plano s (domínio de s). A 
solução no tempo pode ser obtida por meio da transformada inversa de Laplace. 


A transformada de Laplace é definida como: 


F(s) = £L[f(t)] = Í ~ s(t)e “tdt (6.4) 


com s = g + jw, e desde que a integral exista. O operador transformada de 


Laplace é denotado por: 


f(t) — F(s) (6.5) 


6.2.1 Resultados importantes e propriedades 


Em seguida serão apresentadas algumas propriedades da transformada de La- 
place, e a transformada de algumas funções importantes para sistemas de con- 
trole. 
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Função transladada no tempo 


A função transladada, dada por f(t—a), é mostrada na Figura 6.2 em comparação 
à função f(t). 


Furvec trardadats 


Figura 6.2: Função transladada. 
A transformada de Laplace da função transladada é dada por: 


elf = aj = f e ad (6.6) 


Considerando a substituição 7 = t — a, tem-se dr = dt, e com isso: 


Li{f(t-—a)|= a f(r)e + dr =e T f(rje "dr =e“ F(s) (6.7) 


Assim, a translação no tempo equivale a multiplicar a transformada de F(s) 
por e “* no dominio da frequência. 


Translação complexa 


A transformada de Laplace de e~“ f(t), f(t) = 0 para t < 0, é dada por: 


cleo] = f eted f° se Ord = Feta) (68) 
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ou seja, reciprocamente à translação no tempo, a multiplicação e“! f (t) gera uma 


translação complexa, visto que s é uma variável complexa. 


Função degrau 


A função degrau, mostrada na Figura 6.3, é definida da seguinte forma: 


f(t) = E noi (6.9) 


E sua transformada de Laplace é: 


A 


Do 
F(s) = LIF] = | Ac~*dt = É (6.10) 
A função degrau unitário 1(t) é definida para A = 1 e, com isso, 1(s) = L, 
Fueno degrau 
12 
as 
i4 
o 
“uz o oz of o6 os 1 
Figura 6.3: Função degrau unitário 1(t). 
Função rampa 
A função rampa, Figura 6.4, é definida da seguinte forma: 
At t>0 
É) = = 6.11 
f(t l e (6.11) 


e sua transformada de Laplace da rampa é dada por: 


106 Sistemas dinâmicos e mecatrénicos, vol. 1 


F(s) = L[f(t)| = f E T 4 (6.12) 


sendo que a função rampa unitária é definida para A = 1 e, com isso, F(s) = = 


Figura 6.4: Função rampa. 


Funções seno e cosseno 
A função seno é definida da seguinte forma: 
Asin(wt) t>0 
$) = a 6.13 
f(t) l 4 pi (6.13) 
Considerando a identidade: 
i oO) oe E jwt _ „— jwt 
sin(wt) = 2; G e ) 


podemos escrever: 


F(s) = £[Asiniat)| =A [™ (ett) = ÃO (614 
0 


A transformada da função cosseno pode ser determinada de forma semelhante, 
sendo dada por: 
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As 


F(s)= Paw 


Funcao seno 


Figura 6.5: Função seno. 


Função pulso 


A função pulso é definida da seguinte forma: 


A 
=| E Ostan 
O to<t<o0 
Com isso, 
E EA to A — st 5 A —sty 
F(s) = £[f(t)] = [ mede = (1 —e-*) 
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(6.15) 


(6.16) 


(6.17) 
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Figura 6.6: Função pulso. 


Função impulso 


A função impulso, Figura 6.7, é definida da seguinte forma: 


re dim à O<t<to tis) 
= 0—+ ‘ 
0 tp <t<0 


Com isso, 


t t 
F(s) = L[f(t)] = Į ; lim A sta = lim ° A sta = lim Za -e “)=A 
o to>0to t 


to > 0 0 0 to—0 sto 
(6.19) 
A função impulso cuja área é unitária é chamada de impulso unitário ou delta 
de Dirac: 
t=t 
ira S i (6.20) 
O tÆto 
com 
L[d(t — to)] = e~* (6.21) 
e 


Ljót) =1 (6.22) 
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Frm ree 


“2 
o as º oz sa 
i 


Figura 6.7: Função impulso. 


Função exponencial 


A função exponencial é definida da seguinte forma: 


Ae t>0 
we 2 6.23 
E P (6.23) 
Com isso, 
oo oo A 
F(s) = £[Ae~*] = f Ae~%e*tdt = A f e-la+stdt = —— (624) 
0 0 s+a 


toscas spanare 
<< — 
mm 


Figura 6.8: Função exponencial. 


Existem inúmeras outras funções que podem ser utilizadas em sistemas de 
controle. Contudo, existem tabelas disponíveis na literatura, que podem ser con- 
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[ k l / sega ond = E) (6.30) 


s 
De forma semelhante à diferenciação, a generalização é possível, com sucessi- 


vas integrações f ee / f(t)dt - - - dt resultando no plano s, após a transformação 


Ca e? 
n-vezes 
de Laplace, em = 


Teoremas de valor inicial e final 


O teorema do valor inicial pode ser resumido na seguinte expressão: 


f(0) = lim sF(s). (6.31) 


Já o teorema do valor final é expresso por: 


f(o0) = lim f(t) = lim sF(s). (6.32) 


Ambos os teoremas são importantes na análise das respostas transitória e de 


estado estacionário de sistemas de controle. 


Teorema da convolução 


O teorema da convolução estabelece uma relação entre a integral de convolução e a 
transformada de Laplace na determinação da solução de uma equação diferencial. 
Considere os diagramas de blocos na Figura 6.9. 


“0 alt) to 


U(s) G(s) Y (s) 


Figura 6.9: Diagramas de blocos de um sistema dinâmico. 


De acordo com o teorema da convolugao, a seguinte equação é satisfeita: 


t 
Y (s) = G(s)U(s) = £ l | u(t — r)g(r)ar| (6.33) 
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Ainda, 


t 
y(t) = f u(t — T)g(T)dr = CL! [G(s)U(s)] (6.34) 


sendo que £7! indica a transformada inversa de Laplace. 

O teorema da convolução estabelece que a resposta y(t) do sistema g(t) a uma 
entrada u(t) pode ser determinada, de forma alternativa à integral de convolução, 
pelo produto de duas funções algébricas no plano s com subsequente aplicação 


da transformação inversa. 


Linearidade da transformada de Laplace 


A transformação de Laplace é uma operação linear, ou seja, a transformação de 
uma combinação linear entre duas funções f(t) e g(t) é igual à combinação linear 
de suas funções transformadas F(s) e G(s). 


L [af (t) + bg(t)] = aL [f(t)] + b£ [g(t)] 


6.2.2 Transformada inversa de Laplace 


A transformação inversa de Laplace é determinada pela integral de inversão. 
=l 
Assim, considerando que F(s) ar f(t): 


f(t) = £7 [F(s)] = / g2 F(s)e%ds (6.35) 


n— joo 
com c € R. 

Felizmente, não precisamos resolver sempre a integral de inversão, podemos 
consultar tabelas de transformadas. Entretanto, para obter f(t) a partir dessa 
consulta, a função F(s) deve ser identificável nessas tabelas, o que nem sempre 
é imediato. Se F(s) não puder ser identificada prontamente, pode-se expandir 
F(s) em frações parciais e encontrar suas parcelas mais simples em tabelas. Ge- 
ralmente isso não é uma tarefa complicada, já que a transformada de Laplace 
ocorre frequentemente na forma F(s) = no sendo A(s) e B(s) polinômios em 
s com o grau de A(s) menor que o grau de B(s). 
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6.3 Solução de equações diferenciais pelo método da 


transformada de Laplace 


O método da transformada de Laplace (TL) permite obter a solução geral de 
EDO lineares e invariantes no tempo. Vejamos o exemplo de um sistema de 2º 


ordem. Seja a seguinte equação diferencial: 


j+3y+2y=0 


com as condições iniciais: y(0) = a, y(0) = b, a e b constantes. 


Com o objetivo de resolver a equação considerando as condições iniciais, uti- 
lizaremos o método da transformada de Laplace. Assim, aplicando a propriedade 


da diferenciagao obtém-se: 


0 
as+3a+b 


s*Y(s) — as — b + 3(sY(s) — a) + 2Y(s) 
s?Y (s) + 38Y (s) + 2Y(s) 


Insolando-se Y (s): 


_as+3a+b _ as + 3a +b 


"= Spari F142) 


Então, expandindo-se o lado direito da equação em frações parciais: 


Viaja DO 2a +b a+b 
“Br? etl #42 


Com isso, é possível encontrar a solução para o problema de valor inicial, 


considerando a propriedade de linearidade e aplicando a transformada inversa de 


_, /2a+b _, fat+obd 
4 E: 1 RE 1 
WISE (=) f (=) 


e, considerando a transformada da função exponencial, Equação (6.24), obtém-se 


Laplace: 


a solução: 


y(t) = (2a + b)e”! — (a + bje” 
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A utilidade da transformação de Laplace não se reduz à solução de equações 
diferenciais. Ela permite a definição do conceito de função de transferência, que 
é fundamental tanto para a análise como para o projeto de sistemas de controle. 


6.4 Função de transferência 


Antes de estabelecer o conceito de função de transferência (FT), e com o objetivo 
de melhor compreender o seu significado, vamos considerar o mesmo exemplo 


do sistema na Seção 6.3, entretanto, agora sujeito a uma entrada u(t), como 


foo Ln 


Figura 6.10: Sistema dinâmico. 


mostrado na Figura 6.10. 


Dessa forma, dada uma entrada u(t) e as condições iniciais y(0) = a, y(0) = b, 


a e b constantes, o sistema pode ser descrito pela seguinte equação diferencial: 


y+3y+2y = u(t) 
Aplicando a TL e isolando Y(s), obtém-se: 


_ U(s)+as+3a+b 


ie 8 +3s+2 


(6.36) 


Neste ponto, separamos o lado direito da Equação (6.36) em duas parcelas, 
a primeira contendo apenas a TL da entrada, U(s), e a segunda contendo as 
condições iniciais, conforme a Equação (6.37). A parte da resposta do sistema 
que dependente da entrada U (s) é chamada de resposta forçada. Já a outra parte, 


que depende apenas das condições iniciais, chamamos de resposta natural. 


U(s) as + 3a +b 
s2 +38 +2 s2 +38 +2 
e — 

Resposta forçada Resposta natural 


Y(s) = (6.37) 


A resposta natural depende apenas das condições iniciais e da dinâmica ca- 
racterística do sistema, diferindo apenas em razão dos valores dessas condições 
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iniciais. A resposta forçada, entretanto, pode diferir significativamente depen- 
dendo de cada u(t). Em virtude dessa característica, em sistemas de controle 
interessa estudar a relação entre a dinâmica do sistema e a entrada. O que se faz 
então é considerar as condições iniciais nulas, ou seja, y(0) = ġ(0) = 0. 


1 
s2+3s+2 


Assim, para as diversas entradas U (s), considerando em cada caso sua respectiva 


Y(s) = U(s) (6.38) 


TL, podem-se determinar as características da resposta do sistema dinâmico. 


Consideremos agora o sistema mostrado na Figura 6.11. 


U(s) Y(s) 


Figura 6.11: Diagrama de blocos do sistema dinâmico após a aplicação da TL. 


Para condições iniciais nulas tem-se: 


Y (s) = G(s)U(s) (6.39) 
ou 
G(s) = DO) (6.40) 


G(s) é chamada de FT, sendo definida como a relação entre as transformadas de 
Laplace da saída y e da entrada u considerando condições iniciais nulas. 

A partir dessa definição fica claro que no caso do sistema dinâmico do exemplo 
anterior, comparando a Equação (6.38) com a Equação (6.40), tem-se que a FT 


é dada por: 


Y (s) 1 


Dis)” ETT pues 


Ainda, considerando o teorema da convolução, tem-se: 


¥(s) = G(s)U(s) > y(t) = f “até EER (6.42) 
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o que deixa evidente a relação entre a FT G(s) e a função g(t), que é chamada 
de função peso. 
A forma geral de uma FT é: 


_ ¥(s) _ bos™ + bi8—! + --- + bm—18 + bm 


G = = 
(s) U(s) ags"+asl+...+anis+an 


(6.43) 


com n > m. As m raízes do polinômio no numerador de G(s) são chamadas de 
zeros de G(s). As raízes do polinômio no denominador de G(s) são chamadas de 
polos de G(s). 

As FT são modelos matemáticos de sistemas dinâmicos, entretanto, não car- 
regam nenhuma informação com relação à construção física dos sistemas, já que 
dois sistemas completamente diferentes podem possuir FT idênticas. Assim, as 
FT carregam apenas informações sobre o comportamento dinâmico de um sis- 
tema, a partir da relação entre a entrada e a saída deste. 

AFT também é conhecida como a resposta impulsiva de um sistema dinâmico, 
já que a TL do impulso unitário C(d(t)) = 1, e fazendo U(s) = 1 na Equação 
(6.40), resulta: 


Y(s) = G(s) (6.44) 


6.5 Estabilidade de sistemas de controle 


A estabilidade de um sistema de controle pode ser verificada a partir de sua 
resposta a uma entrada ou a perturbações. De forma intuitiva, um sistema de 
controle é estável se partindo de uma vizinhança de um ponto de equilíbrio, 
mesmo na presença de perturbações, se mantém na vizinhança desse equilíbrio. 
O sistema será assintoticamente estável quando se aproximar assintoticamente 
desse ponto de equilíbrio. 

Outra forma de entender a definição intuitiva anterior relaciona-se à resposta 
impulsiva, ou seja, um sistema de controle é estável se sua resposta ao impulso 
tender para a origem ao longo do tempo. 

Entretanto, essa definição intuitiva não é adequada a muitas situações em 
sistemas de controle, já que na maioria das vezes o sistema é forçado, ou seja, 
possui uma entrada qualquer u(t) não nula. Nesses casos, uma definição possível 
é a de que um sistema de controle é estável se uma entrada limitada produz uma 
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saída limitada. Embora seja bastante útil, essa definição também não se aplica a 


todas as situações possíveis em sistemas de controle. 


Assim, especificamente no caso dos sistemas lineares e invariantes no tempo, a 
condição para a estabilidade assintótica é que todos os polos do sistema estejam no 
semiplano esquerdo do plano s, ou seja, devem ser reais e negativos ou complexos 


com parte real negativa. 


O problema dessa última definição está relacionado com a necessidade de 
determinar os polos das FT. Para sistemas de primeira ou segunda ordem, a 
determinação dos polos é direta, entretanto, para sistemas de ordem superior a 
dificuldade aumenta. Dessa forma, o critério de estabilidade de Routh-Hurwitz 
é usado para determinar o número de polos localizados no semiplano direito do 


plano s. 


6.5.1 Critério de estabilidade de Routh-Hurwitz 


O critério de estabilidade de Routh-Hurwitz é um método para a determinação 
da estabilidade de sistemas lineares e invariantes no tempo. À principal vantagem 
desse método está no fato de não ser necessário calcular todas os polos da FT. A 


aplicação do método é bastante direta, como será mostrado em seguida. 


Seja a seguinte FT: 


_ bos™ + b18™—) +... + bm-15 + bm 


G(s) = 2 a 6.45 
(s) aos” + as"! +--+ bp_is + bn (a 
A partir do polinômio característico da FT: 

aos” +a”! + tna tba =0 (6.46) 


deve-se construir a matriz de Routh-Hurwitz, como mostrado a seguir: 
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5 ag ao a4 aĝ 
s”! | ay ag as a7 
g”? bi bo by by 

-3 
g Ci O C3 % 

(6.47) 

s? ej €2 
s fi 
0 
s gı 


sendo que os coeficientes da terceira linha em diante são determinados pelas 
seguintes fórmulas: 


bı = a = ay aj 
-sa| s ad -a| A É 
1 2 1 3 
cı = ae | Pq C? = do A ose (6.48) 
-a| pii | 
ho 
== 


Depois de construída a matriz de Routh-Hurwitz, Equação (6.45). devem-se 
observar os sinais dos coeficientes da primeira coluna. O número de trocas de 
sinais indica o número de polos no semiplano direito. 

O critério de estabilidade de Routh-Hurwitz também pode ser utilizado para 
determinar a margem de ganho em um sistema de controle de malha fechada. 
Por exemplo, seja o sistema de controle da Figura 6.12. 

A FT de malha fechada desse sistema é: 

Y(s) __ KG(s) 


Cur(s) = Tra) = 14 KG(s) He) 


(6.49) 


Aplicando-se o critério de Routh-Hurwitz no polinômio característico da FT 
de malha fechada: 
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Figura 6.12: Diagrama de blocos do sistema de controle de malha fechada, 


1+ KG(s)H(s) = 0 (6.50) 


é possível determinar os valores do ganho K para os quais o sistema de malha 
fechada é estável. 

Vejamos a aplicação do critério de estabilidade de Routh-Hurwitz a um exem- 
plo. Seja a FT: 


N(s) 
ha st + 2s3 + 3s? +458+5 tat 
O polinômio característico da FT na Equação (6.51) é: 
s* + 28° +38 + 48+5=0 (6.52) 


Assim, inicialmente deve-se construir a matriz de Routh-Hurwitz, com os 
coeficientes a determinar. 


BITS 

3/2 4 

2|by b (6.53) 
1 


0| dy 


vo a www 


Em seguida determinam-se os coeficientes bı e be, 


= 

—det 
2 4 
=~ 


is 1 5 
20 (6.54) 
E ed 
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resultando em: 
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s“|1 3 5 

#2 4 

sii & (6.55) 
s! Cl 

3? dy 


Da mesma forma, determina-se o coeficiente cy da matriz de Routh-Hurwitz: 


ci 


—det | midis | 
1 5 
e oe —6 (6.56) 
s*| 1 3 5 
s°| 2 4 
s*/ 1 5 (6.57) 
s! | —6 
3° dı 


Finalmente, determina-se o coeficiente d, e a matriz de Routh-Hurwitz estará 


completa. 


di 


di | 1 5 | 
-6 0 

= =$ (6.58) 
Fit 34 
s'| 2 4 
|1 5 (6.59) 
s! | —6 
s| 5 


Observando os coeficientes da primeira coluna verifica-se que há duas tro- 
cas de sinal, indicando que o sistema possui dois polos no semiplano direito e, 
consequentemente, o sistema é instável. 
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6.6 Análise de sistemas de controle pelo critério de 


Nyquist 


O método de Nyquist é um procedimento para a determinação da estabilidade 
relativa e da estabilidade absoluta de um sistema de controle de malha fechada. 
Considerando o sistema de controle da Figura 6.12, com K = 1, tem-se que a FT 
de malha fechada é: 


G(s) 
1+ G(s)H(s) 


e. com isso, os polos de malha fechada são dados pelo polinômio característico: 


Gmr(s) = (6.60) 


1+ G(s)H(s) =0 (6.61) 


Dessa forma, a partir de um gráfico da resposta em freqéncia da função de 
transferência de malha aberta: 


G(s)H(s) (6.62) 


podem ser determinadas tanto a estabilidade absoluta como a estabilidade re- 
lativa, ou seja, margem de fase e margem de ganho. O grafico de Nyquist 
caracteriza-se por ser um mapeamento envolvendo a variável complexa s e uma 
função complexa que, nesse caso específico, é a FT de malha aberta. 

A Figura 6.13 mostra a relação entre pontos no plano s e seu mapeamento 
pela FT G(s) no plano G(s). Na construção do diagrama de Nyquist, apenas 
uma região específica do plano s é mapeada no plano G(s), chamada de percurso 


de Nyquist. 


o a Re (G(s)) 


Figura 6.13: Mapeamento complexo. 
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O percurso de Nyquist, utilizado na contrução do diagrama de Nyquist, é um 
percurso fechado no plano s (Figura 6.14), isto é, uma curva contínua que se 
inicia e termina em um mesmo ponto. Além disso, um percurso fechado no plano 
s é mapeado em um percurso fechado no plano G(s). 


© 


Re 


Im 


Figura 6.14: Percurso fechado no plano s. 


Ao percorrer um percurso num sentido prescrito, os pontos à direita desse 
percurso são ditos envolvidos, ou circunscritos, por ele. Além disso, um percurso 


realizado no sentido horário é definido com sentido direto. 


Im 


envolvido 


a Re 


Figura 6.15: Envolvimento no plano s. 


A origem é envolvida n vezes no sentido direto se uma linha radial, partindo da 
origem a um ponto sobre o percurso no plano G(s), percorrendo completamente 
o percurso fechado, envolver no sentido direto a origem por 360 graus. 

Uma propriedade importante desse tipo de mapeamento é que o número de 
envolvimentos N, da origem, feitos por um contorno fechado no plano G(s) é igual 
ao número de zeros menos o número de polos envolvidos pelo contorno fechado 
no plano s, ou seja, 
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N=Z-P (6.63) 


Se a origem está envolvida pelo contorno G(s), então N > 0. Por outro lado, 


se a origem não está envolvida, então N < 0. 


6.6.1 Percurso de Nyquist 


O percurso de Nyquist envolve completamente o semiplano direito do plano s 
em um contorno fechado, como mostrado na Figura 6.16, com R > œ e p > 0. 
Dessa forma, fica evidente que se houver polos no semiplano direito do plano s, 
estes estarão envolvidos no percurso de Nyquist. Cada segmento do percurso de 


Nyquist pode ser descrito da seguinte forma: 


ab s=jw 0 <w < wo 
be s= limpsojwo + pe? —90° < 0 < 90° 


cd s=jw wo < w < oO 
def s=limpso Re” 90º < 9 < —90° 
se aiii wide (6.64) 
fg s=jw —00 < w < —wo 


gh s= limpo —jwo + pe” —90° < 0 < 90° 
hi s= jw -w <w <0 


ija s=lim,s0 pel? —90º < 9 < 90º 


6.6.2 Critério de estabilidade de Nyquist 


Consideremos o sistema de controle de malha fechada mostrado na Figura 6.17 e 
a FT de malha fechada: 


G(s) 
1+ G(s)H(s) 


A condição para que o sistema seja estável é que todos os polos da FT da 


Gmr(s) = (6.65) 


Equação (6.65) estejam localizados no semiplano esquerdo do plano s. Alterna- 
tivamente, pode-se dizer que as raízes do polinômio característico: 
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Figura 6.17: Sistema de controle de malha fechada. 


1+ G(s)H(s) = 0 (6.66) 


devem ser negativas ou, se forem raízes complexas conjugadas, devem ter parte 
real negativa. O critério de estabilidade de Nyquist estabelece quantos polos, ou 
raízes da Equação (6.66), estão localizados no semiplano direito do plano s, em 
malha fechada, permitindo, assim, determinar a estabilidade de um sistema de 
controle de malha fechada a partir da FT de malha aberta. 


Critério de estabilidade 


e Seja G(s)H(s) a FT de malha aberta de um sistema de controle de malha 
fechada. O sistema de controle de malha fechada é estável se, e somente se, 
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N=-P<0 (6.67) 


— P > 0: o número de polos de GH no semiplano direito do plano s; 


— N: o número de envolvimentos no sentido direto no plano G(s)H(s) 


do ponto —1 + 70. 
e Se N > 0, o número de polos no semiplano direito é determinado por: 


Z=N+P (6.68) 


e Se N <0e P=0, o ponto —1 + 70 nao é envolvido, e o sistema é estável. 


Vejamos agora um exemplo considerando a FT: 


G(s) H(s) = Goa 


cujo diagrama de Nyquist pode ser visto na Figura 6.18. Fica evidente que o 
ponto —1 + j0 é envolvido uma vez no sentido direto. Como P = 1, ou seja, 


(6.69) 


existe um polo de malha aberta no semiplano direito, então esse sistema, em 


malha fechada, possui dois polos no semiplano direito, sendo instável. 


Nyquist Diagram 

20 ' y > s 

"| Ss (-1,0) 

10} è | 
A envolvido 
= [cc 

-10+ | 

-15} 

-20 - Y 

2 AB A6 14 “12 1 08 06 04 « 0 

Real Axis 


Figura 6.18: Diagrama de Nyquist. 


Capitulo 7 


Controle por realimentação dos 


estados 


7.1 Introdução 


O controle no espaço dos estados é realizado por meio da realimentação dos 
estados do sistema. O problema de controle pode ser representado por equações 


em espaço de estados conforme a Equação (7.1): 


X = AX + BU (7.1) 
Y=CX+DU 


em que À é uma matriz de coeficiente n x n (matriz de controle do processo), B 
é uma matriz de controle n x r, D e C é uma matriz resposta m Xx n. À variável 
X representa o vetor de estados, U é um vetor de controle r-dimensional e Y é 


um vetor resposta m-dimensional. 


Pode-se verificar a representativa do sistema em espaço de estados por meio 
de diagramas de blocos conforme a Figura 7.1. 

O sistema da Equação (7.1) é dito como controlável se existir um vetor U que 
leve o sistema para a origem em um tempo finito. Assim, o sistema da Equação 


(7.1) pode ser considerando um sistema em espaço de estados controlável se a 
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Figura 7.1: Diagrama de blocos em malha aberta. 


matriz da Equação (7.2) tiver posto igual a n. 


M = |B AB A?B...A"—B] (7.2) 


Considerando U = —KX a lei de controle, em que K é a matriz de ganho de 
realimentação de estados, e substituindo U = —KX na Equação (7.1), obtém-se 


a correspondente em malha fechada conforme a Equação (7.3): 


X=(A-BK)X (7.3) 


A representação em diagramas de blocos do sistema com controle por reali- 


mentação de estados pode ser vista na Figura 7.2. 


Obtém-se a solução da Equação (7.3) (obtida pelo método de integração sim- 


ples) é descrita na Equação 7.4: 


X = eA-BKx(0) (7.4) 


sendo X(0) o estado inicial causado por distúrbio externos. Percebe-se pela Equa- 
ção (7.4) que as características de resposta do sistema e o critério de estabilidade 
podem ser determinados pelos autovalores de A — BK. Existem diversas técni- 
cas para encontrar a matriz K, entre elas podem-se citar a alocação de polos e o 
regulador quadrático linear (LQR). 
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Figura 7.2: Diagrama de blocos do controle por realimentação de estados. 


7.2 Projeto de controle por alocação de polos 
Nesta seção serão apresentadas três estratégias para obtenção da matriz de ganho 
K para o controle por alocação polos. 
7.2.1 Primeira estratégia 
Seja por definição a matriz de transformação da Equação (7.5): 

T=MW (7.5) 
em que T é a matriz de controlabilidade da Equação (7.2) e W é dada por: 


GQn-1 Qn-2 K a 1 
Qn—-2 Qûn-3 K 1 0 
M M K Mm (7.6) 


em que os elementos a; são os coeficientes do polinômio característico: 


|sI — A| = s” + a)8""' + K + an-1 + an LATI 
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Deve-se então escrever o polinômio característico para o sistema com os polos 


desejados: 


(s— m)(s — uo)K(s— in) = 8" + as"! + K + an-15 + On (7.8) 


em que pi são os polos desejados. 


A matriz de ganho de retroação de estado é obtida de: 


K = lan —Gn Unir- K ag—aq -Qim a;|T (7.9) 


sendo a; obtido da Equação (7.8), a; da Equação (7.7) e T da Equação (7.5) 


7.2.2 Segunda estratégia 


Deve-se escrever a matriz de ganho de retroação de estados na seguinte forma: 
K=[k ko K kal (7.10) 
A matriz K é obtida da seguinte forma: 
|sI — A + BK| = (s — p)(8 — 2) K (8 — pn) (7.11) 
em que u; são os polos desejados. 


7.2.3 Terceira estratégia 


Considerando a fórmula de Ackermann: 


(A) = A” +a A"! + aA”? + K +an1A +anl (7.12) 


a; é obtido da Equação (7.7). A matriz K é obtida de: 
K=[00 K UM o(A) (7.13) 


em que M é a matriz de controlabilidade da Equação (7.2). 

Para obtenção da matriz de ganho utilizando-se o MATLAB, podem-se con- 
siderar os comandos acker ou place. K = place(A,B,P,) calcula a matriz K 
de ganhos de realimentação em que os autovalores de A — BK são especificados 
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no vetor Pg. Nenhum autovalor deve ter multiplicidade maior que o número de 
entradas. K = acker(A,B, P4) calcula a matriz K de ganhos de realimenta- 
ção em que um sistema com uma entrada X = AX + BU e com realimentação 
de U = —KX tem polos de malha fechada especificados no vetor P , isto é, 
.Pq = eig(A — BK). 


7.3 Problema de controle ótimo quadrático 


Considerando o problema de controle ótimo com a seguinte sistema de equações: 
X = AX+BU (7.14) 


determinar a matriz K do vetor de controle ótimo: 


U=-KX (7.15) 


de modo a minimizar o indice de desempenho: 


J = (XTQX + UTRUJdt (7.16) 


em que Q é uma matriz hermetiana ou simétrica real definida positiva (ou se- 
midefinida positiva) e R é uma matriz hermetiana ou real simétrica definida 
positiva. 

As matrizes Q e R determinam a importância relativa do erro e do dispêndio 
de energia. Em consequência, se os elementos da matriz K forem determinados 
de modo a minimizar o índice de desempenho, então U = —KX é ótimo qualquer 
que seja o estado inicial X(0). 

Para resolver o problema de otimização, substituímos a Equação (7.15) na 
Equação (7.14) para obter: X = AX — BKX = (A — BK)X, admitindo-se que 
a matriz A — BK seja estável, ou seja, que os autovalores da matriz A — BK 
tenham parte real negativa. Substituindo-se a Equação (7.15) na Equação (7.16), 
temos: 


fa / “(xTQX+X7KTRKX) = i ” XT(Q+ KTRK) (7.17) 
0 0 
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considerando que: XT(Q + KRK)X = —4(XTPX), em que P é uma matriz 
hermitiana ou real simétrica e definida positiva. 


Obtém-se, assim, 


XT(Q + KTRK)X = —XPXX’PX = -X7 [(A-BK)"P+Q] (7.18) 


Comparando ambos os membros dessa última equação e observando que ela 


deve ser verdadeira para qualquer x, deve-se ter: 
(A — BK)’ P + P(A - BK) = -(Q + KTRK) (7.19) 


Pelo segundo método de Lyapunov, se A — BK é uma matriz estável, então 
existe uma matriz P definida positiva que satisfaz a Equação (7.19). Por conse- 
guinte, deve-se determinar os elementos de P a partir dessa equação e verificar 
se ela é definida positiva. 


O índice de desempenho J pode ser calculado como: 


fe f ” XT(Q + KRK)Xdt = -XT (o0)PX(00) + X7(0)PX(0) (7.20) 


Como se admite que todos os autovalores de A — BK têm parte real negativa, 


tem-se X(oo) + 0 . Obtém-se, portanto: 
J = XT (0) PX (0) (7.21) 


Assim, o índice de desempenho J pode ser obtido em termos dos estados iniciais 
X(0) eP. 

Para obter a solução do problema de controle ótimo quadrático, procede-se 
como a seguir: supondo que R é uma matriz hermetiana ou real simétrica definida 
positiva, pode-se escrever R = TTT, em que T é uma matriz não singular. 
Então, temos: (ATKTBT)P + P(A — BK) + Q + KTTTTK = 0, que pode ser 
escrita sob a forma: ATP + PA + [TK — (T7)C-DB”PI[TK — (TT)\-)BTP] — 
PBR” )B'P+Q=0 

A minimização de J com relação a K requer a minimização de: X7[TK — 
(TT) YBP}" (TK — (TT) DB7P]X com respeito a K. Como essa expressão 
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é não negativa, o mínimo ocorre quando ela vale zero, ou seja, quando TK = 
(TT -DBTP, assim: 


K = TCD(T7)(-UB7p = Kk(c-DB7P (7.22) 


A Equação (7.22) fornece a matriz ótima K. Em consequência, a lei de 
controle ótimo para o problema de controle ótimo quadratico, quando o índice de 


desempenho é dado pela Equação (7.22), é linear e dada por: 
U = -KX = -R“)B' Px (7.23) 


A matriz P na Equação (7.23) deve satisfazer a Equação (7.13) ou a seguinte 
equação reduzida: 


PA + ATP — PBR” )B’P+Q=0 (7.24) 


Essa equação é chamada de equação matricial reduzida de Riccati. 

No MATLAB, o comando K = lqr(A, B, Q, R) resolve o problema do regula- 
dor quadrático linear contínuo no tempo e a equação de Riccati associada. Outro 
comando é [K, P, E] == lqar(A, B, Q, R), em que K é a matriz de controle, P é 


a matriz de Riccati e E são os polos do sistema. 


7.4 Controle da vibração de sistemas mecânicos vi- 


bracionais 


Nesta seção são apresentados dois exemplos de aplicação do controle por reali- 
mentação de estado, considerando um sistema com uma massa e outro com duas 
massas acopladas. 


7.4.1 Controle de um sistema mecânico vibracional com uma 
massa 


Na Figura 7.3, pode-se observar um sistema oscilador mecânico vibracional com- 
posto de uma massa oscilante m, da força da mola k e da força do amortecedor 


b. 


Considerando o lagrangeano: 
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Figura 7.3: Sistema mecânico oscilante com um grau de liberdade. 


= 7 OF 
L = Ep — Ep (7.25) 
em que E, e Ep são as energias cinética e potencial, respectivamente, as equações 


de movimento para a coordenada podem ser obtidas de: 


d (OL OL 
= |->— =F; 7.26 
dt (a) dm a 
em que i = 1,2,...,N, N é 0 grau de liberdade do sistema, F sao forgas nao 


conservativas e q são coordenadas generalizadas. 


O sistema mecânico da Figura 7.3 tem as seguintes energias e forças não 


conservativas: i 
E; = ama? (7.27) 
1 2 ry 
Ep = ghz (7.28) 
F = —bżt (7.29) 


Aplicando a Equação (7.26) nas Equações (7.27), (7.28) e (7.29), obtemos: 


mã + bi + kz = 0 (7.30) 
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Substituindo 6 = E 


m 


eY= 2, a Equação (7.30) pode ser representada na 
seguinte forma: 
y+ yy t dy =0 (7.31) 


A Equação (7.30) pode ser representada pelo seguinte sistema: 


tt = fá (7.32) 


do —0214 — T2 
em que (x; = y) e (x2 = 9). 

Na Figura 7.4 pode-se observar o sistema da Equação (7.32) considerando os 
seguintes parâmetros: yo = 2, jo = 0, y = 0,05 e 6 = 0,01. 


deslocamento 


Figura 7.4: Histórico no tempo: (A) deslocamento da massa m, (B) velocidade de 
deslocamento da massa m e (C) diagrama de fase. 


Considere agora a introdução de um sinal de controle no sistema da equação 
(7.33): 


21 = T2 (7.33) 


to —d6z) — 9x2 +U 
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em que U = —KX, com: 


= [kra kı,2] 


1 
Do sistema da Equação (7.33) temos as seguintes matrizes: A = | E | 
at = 


0 
eB= "| Para obtenção do ganho K, pode-se considerar a aplicação do con- 


trole ótimo quadrático, ou o método de alocação de polos. Considerando o con- 
trole ótimo, o ganho K pode ser encontrado utilizando o comando [K, P, E) = 
Igr(A,B.Q.R). em que K é a matriz de controle, P é a matriz de Riccati e E 
são os polos do sistema em malha fechada. 


Definindo as matrizes 


elos mi 


R = [1] 


obtemos as seguintes matrizes: 
J [o 9900 1, 3931| 


[1,3427 0,9900 
0,9900 1,3931 


_ [-0,7216 + 0,6924i 
~ |—0,7216 —0,6924i 


Como pode ser observado no vetor E, o sistema em malha fechada tem os 
seguintes polos: (—0,7216 + 0,6924). Considerando a matriz de ganho K, 
temos o sinal de controle: 


U = —0, 99007x: — 1, 393122 (7.34) 
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Na Figura 7.5 pode-se observar o sistema da Equação (7.32) com o controle 
da Equação (7.34). 


o 100 200 300 . no oa Ea 


deslocamento 


Figura 7.5: Histórico no tempo com controle ótimo: (A) deslocamento da massa m, 
(B) velocidade de deslocamento da massa m e (C) diagrama de fase. 


Considerando o controle pelo método de alocação de polos. K pode ser en- 
contrado utilizando o comando K = acker(A,B,P) ou K = place( A,B, P), em 
que K é a matriz de controle e P são os polos desejados para o sistema em malha 
fechada. Definindo que o sistema em malha fechada tenha os mesmos polos do 
sistema em malha fechada com o controle ótimo: (—0,7216 + 0,6924), obtemos 


as seguintes matrizes: 
K = [0,9900 1,3931] 


Considerando a matriz de ganho K, temos o sinal de controle: 


U = —0, 9900x; — 1,3931x2 (7.35) 


Na Figura 7.6 pode-se observar o sistema da Equação (7.32) com o controle 
da Equação (7.35). 
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deslocamento 


oot 
8 
Bos 
-0 8 f— sem controle 
—— com controle 
4 do 
4 0 1 2 
deslocamento 


Figura 7.6: Histórico no tempo com controle ótimo: (A) deslocamento da massa m, 
(B) velocidade de deslocamento da massa m e (C) diagrama de fase. 


7.4.2 Controle de um sistema mecânico vibracional com duas 
massas acopladas 


Na Figura 7.7 pode-se observar um exemplo de sistema com dois graus de liber- 
dade. 


cl c2 


Figura 7.7: Sistema mecânico oscilante com dois graus de liberdade. 
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O sistema mecânico da Figura 7.7 tem as seguintes energias e forças não 


conservativas: i i 
Ex = amd? + a mai? (7.36) 
Log, da gd 2 
E, = =koxº + zkay" + =k (£ — y) (7.37) 
2 2 2 
Fi=-at (7.38) 
Fa = —coy 
L = Ep — Ep (7.39) 


em que E; e E, são as energias cinética e potencial, respectivamente. 
As equações de movimento para a coordenada podem ser obtidas de: 

d (OL OL 

es gh alt ce A 

dt (5%) Ogi á da 

Aplicando a Equação (7.26) nas Equações (7.36). (7.37) e (7.38), obtemos: 
mit + cit + (ki + k2) x — kiy = 0 (7.41) 
may + coy + (kı + kə) y — kız = 0 


itui = a = k — kz = dE = di = kr 
Substituindo ay = 4, a2 = Ft,a3= 7,4 =S,h=peh= ea 


Equação (7.41) pode ser representada na seguinte forma em espaço de estados: 


t = mw (7.42) 
t2 = —Q1T2— (a2 + @3) T1 + a273 
t3 = T4 


ta = —ira — (62+ B3) z3 + Bor 
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Na Figura 7.8 pode-se observar o sistema da Equação (7.31) considerando 
os seguintes parâmetros: a, = 0,1; ag = 0,3, a3 = 0,4, 8; = 0,2, 8 = 0,6, 
pa = 0,8, Tı = 2, rg = 0, 23 = —2, x4 = 0. 


Considerando a introdução de um sinal de controle no sistema da Equação 
(7.42): 


yaaa! dia (7.43) 
t2 = ata — (a2 + a3) 21 + agrs + Ui 

ta = %4 

t4 = —Bixa— (82+ p3) x3 + B271 + U2 


Zi = 
mf É. 
A >" 
Êo $ 
5 8 
3° 2 
v 
o 
e 20 40 60 80 100 2 a 0 1 2 
tis] deslocamento X, [m] 
3 3 
E 2 F 2 
Es È (D) 
1 ei 
v 7 
> | se 
o o 0 
5% E 
€ S 4 
87 E 
ga a 
3 2 2 0 2 4 
0 20 40 60 80 100 E à 
tis] deslocamento x, [m] 


Figura 7.8: Histórico no tempo: (A) deslocamento da massa mı, (B) diagrama de fase 
da massa mı, (C) deslocamento da massa mə e (D) diagrama de fase da massa ma. 
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kia kz kg kis 


K= 
koi koa kag koa 
e 
T1 
x= |” 
T3 
T4 
Do sistema da Equação (7.9), temos as seguintes matrizes: 
0 1 0 0 
a ia (az +a3) —aı a2 0 
0 0 0 1 
Bo 0 —(f2+ 83) —Br 
e 
0 0 
1 
B = ” 
0 0 
os 


Para obtenção do ganho K, pode-se considerar a aplicação do controle ótimo 
quadrático, ou o método de alocação de polos. Considerando o controle ótimo, o 
ganho K pode ser encontrado utilizando o comando [K, P, E] = lqr(A, B, Q, R), 
em que K é a matriz de controle, P é a matriz de Riccati e E são os polos do 


sistema em malha fechada. 


Definindo as matrizes 


Lodo ds 
0010 0 
ii Km © 
ie 8 mi 


obtemos as seguintes matrizes: 
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_ 10,5993 1,0385 0,0261 0,1107 
0,1976 0,1107 0,3248 0,6817 


1,3647 0,5993 —0,0910 0,1976 
0,5993 1,0385 0,0261 0,1107 
—0,0910 0,0261 1,2104 0,3248 
0,1976 0,1107 0,3248 0,6817 


—0, 5883 + 0,8793: 
—0, 5883 — 0,8793: 
—0, 4218 + 1,3137: 
—(), 4218 — 1,3137: 


Como pode ser observado no vetor E, o sistema em malha fechada tem os 
seguintes polos (—0,5883 + 0,8793i) e (—0,4218 + 1,3137i). Considerando a 


matriz de ganho K, temos o sinal de controle: 


Ui = —0,59932, — 1,0385292 — 0,0261 z3 — 0,1107x4 


(7.44) 
Uz = —0,1976x, — 0,1107 x2 — 0,32482r3 — 0,6817x4 


Na Figura 7.9 pode-se observar o sistema da Equação (7.43) com o controle 
da Equação (7.44). 
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velocidade x 2 [ms] 


deslocamento de x , [m] 


deslocamento de x , [m] 
velocidade x , [m/s] 


deslocamento x , [m] 


Figura 7.9: Histórico no tempo com controle por alocação de polos: (A) deslocamento 
da massa mı, (B) diagrama de fase da massa m, (C) deslocamento da massa my e (D) 
diagrama de fase da massa mg. 


Capitulo 8 


Controle ótimo para sistemas 


nao lineares 


8.1 Introdução 


Neste capítulo são apresentadas duas estratégias de controle ótimo aplicadas em 


sistemas não lineares. 


8.2 Controle linear feedback 


O controle por realimentação de estados é um mecanismo matemático que regula 
e estabiliza o comportamento de sistemas dinâmicos. O termo realimentação de 
estados deve-se ao fato de que o sinal de controle é uma função da diferença entre 
valores atuais e desejados das variáveis de estado do sistema. O controle utiliza a 
saída do sistema para realimentá-lo por meio do sinal de controle. A metodologia 
do controle ótimo busca ao mesmo tempo controlar o processo e minimizar um 
índice de desempenho. 

De acordo com Rafikov e Balthazar (2006), a aplicação da técnica do controle 
linear por realimentação de estados em sistemas não lineares deve-se à sua sim- 
plicidade de configuração e implementação. O controle é baseado na teoria da 
estabilidade de Lyapunov e no controle linear quadrático ótimo (LQR). A repre- 
sentação em diagramas de blocos do sistema com controle por realimentação de 
estados pode ser vista na Figura 8.1. 
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Figura 8.1: Diagrama de blocos do controle por realimentação de estados. 


Consideremos um sistema de equações diferenciais ordinárias como não linear 


e controlável na seguinte forma: 
X =AX+9(X)+U (8.1) 


sendo X € R” um vetor de estados, A € R"*" a matriz de estados formada 
pelos termos lineares do sistema, U € R” o vetor de controle, e G(X) um vetor 
de funções contínuas não lineares. O objetivo é achar uma lei de controle U 
que conduza o sistema sob ação de perturbações externas a um estado desejado. 
Esses tipos de regimes podem ser: um ponto de equilíbrio, uma órbita periódica 


ou uma órbita não periódica. 


O vetor de controle U consiste em duas partes: 


U = Uff + Usa (8.2) 


em que Upp é o termo feedforward, que pode ser escrito na seguinte forma: 


Uys = Xa — AXa — g(Xa) (8.3) 


sendo X4 o estado de equilíbrio desejado, e U pa é o controle linear feedback e tem 
a seguinte forma: 
U fa = Bu (8.4) 
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em que B € R”*™ é uma matriz constante. 


Definindo o erro dos estados como: 
E=X-Xy (8.5) 


e substituindo as Equações (8.5), (8.4) e (8.3) na Equação (8.1), pode-se obter a 


seguinte equação: 
E = AE + G(X) — G(X4) + Bu (8.6) 


A parte não linear do sistema da Equação (8.1) pode ser escrita da seguinte 


forma: 


g(X) — g(Xa) = G(E, Xa)(X — Xa) (8.7) 


sendo G(E, Xa) uma matriz limitada, cujos elementos dependem de E e X4. 
Considerando a Equação (8.7), o sistema da Equação (8.6) adquire a seguinte 
forma: 


E = AE + G(E, X4)E + Bu (8.8) 


Se existirem as matrizes Q e R, escolhidas de forma a serem definidas posi- 


tivas, com Q simétrica, tais que a matriz: 


Q = Q - GT (E, X4)P — PG(E, Xa) (8.9) 


seja definida positiva, sendo a matriz P a solução da seguinte equação diferencial 
matricial de Riccatti: 


PA + ATP —- PBR 'BTP+Q=0 (8.10) 
então o controle linear feedback: 


U = -R~'B’PE = -KE (8.11) 


é ótimo e transfere o sistema não linear da Equação (8.6), de qualquer estado 


inicial, ao estado final: 


E(ts) =0 (8.12) 
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Sendo assim, para determinar os valores do ganhos K é por meio da Minimi- 
zação do funcional definido por: 


I= E ij (ETQE + u”Ru) dt (8.13) 


Para os casos em que analisar a matriz Q analiticamente é muito difícil, é 
possível analisá-la numericamente considerando a função L(t) = ET (t)Q(t)E(t), 
calculada na trajetória ótima. Se L(t) é definida positiva para todo o intervalo 


de tempo, então a matriz Q é definida positiva. 


8.3 Controle linear feedback aplicado em um sistema 


eletromecânico não linear 


O sistema eletromecânico mostrado na Figura 8.2 representa um oscilador mecâ- 
nico. Como pode ser observado, o sistema é composto por um sistema mecânico 
acoplado a um circuito elétrico. A massa (m) e o coeficiente de amortecimento 
(d) são considerados constantes. O termo rigidez elástica do coeficiente da mola 


(k) é representado por um componente linear (k;) e um não linear (kn): 


k = kiz + kuz’ (8.14) 


| > 
Cix) 
L) 


Figura 8.2: Sistema eletromecanico. 


A equação da parte mecânica é: 
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më + dé + kız + kya? = Fm — Fe (8.15) 


em que F representa a força magnética, e F., a força elétrica. 


O circuito elétrico usado para acionar o oscilador mecânico é do tipo RLC 
com fonte de tensão senoidal (Vaccos(wt)). O acoplamento entre os sistemas 
elétrico e mecânico é realizado por uma força magnética não linear (Fm), gerada 


no solenoide. 


À equação que descreve a dinâmica do circuito elétrico pode ser representada 
por: 
Q 


L(z)Q + RÅ + Ta) = V (8.16) 


em que Q representa a corrente elétrica no circuito, V a fonte de tensão, R a 
resistência elétrica, L(x) a indutância e C(x) a capacitância. 


A indutância pode ser escrita como: 


1 
L(x) = pN?’ Ar f = =| (8.17) 


em que A; é a área da seção transversal do solenoide, N é o número de voltas, | 


é o comprimento do solenoide e uy é a permeabilidade magnética. 


A energia no capacitor pode ser calculada por: 


e. M 
dW = 56,10 (8.18) 


A energia armazenada é obtida pela integração da Equação (8.18): 
1 2 
W = z0) (8.19) 


A capacitância pode ser escrita como: 


C(x) = = (8.20) 


em que sy é a permissividade do vácuo, Ac é a área da placa e ç é a distância 
entre as placas. 
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Assumindo que: 


VC(z)=Q (8.21) 
e AF 
nd a (8.22) 


a energia magnética pode ser obtida de: 


1 r? 
ae AE ; 
Wm 2 (a) (8.23) 
A força magnética é representada por: 
RR 1 5 
Em = af Lig) = 29 L(x) (8.24) 


Considerando as Equações (8.17) a (8.24), as equações (8.16) e (8.17) obtemos: 


d, {ki Fna HoN? AQ? Q? 
did a om Tia ~ 2m(l—- z)? © 2meoAc 
ROU- =F Q(i-—2z)*(n-—2) _ -2V 

poN?Ar EopoN?ArAc  poN?Ar 


(8.25) 
Q+ 


O sistema da Equação (8.25) pode ser representado em espaços de estados: 


ti = a (8.26) 
. 3 aati 2 

fg = —@1t2 — û2%1 — agzj + doa)? + 0523 

re = gä 

wy = —byr4 + bozgr — bazar? — bax, 24 — bsx?xr3 + bez?T3 


—b7r3 + bg V — boa, V + b,0r7V 


es ees. ee. enc ae a 
em que: a = +, 02 = =, 03 = E, q = a 105 = qmeção! Ol = NTAN’ 


= Ru ~P 261) — __(o+2l) 
ba= poN? Ay’ b3s= NEAT? ba = EoHoN? A Ac’ bs = EoHoNZAÇÃo* be 
by= ql b 12 by = 2! b 1 

opo N AAC’ “8 ~ PNTA’ poN7A;,? 710 = jigN7A;" 

Para simulações numéricas serão considerados os seguintes parâmetros: a 


Ui: ao = Ts og = Ss og — 1,5: os — 0,0;  — 5 Oe — 1: hg — 00B; bu 


= 1 
T EgptoN? Ay Ag’? 


Il 


II 
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—8, 4745(1073) 3b; = 1,6949(1073): bg = 8,85(107!2); by = 1,4124(1078); bg = 
bg = 3; bho=l;l=1. 

A variação do deslocamento e a tensão elétrica do sistema da Equação (8.26) 
podem ser observados na Figura 8.3. 


Sistema Mecânico Sistema Elétrico 


o o 
b ao 
o 
b 


z 
= 0.3} = 02 
2 E 
$ 02 zo 
Ei 0.1 | Š 02 | 
0 0.4} 
| 
-0.15 -06t 
0 20 40 60 Bo 100 0 20 40 60 Bo 100 
tempo [s] tempo [s] 


Figura 8.3: Sistema eletromecânico. (A) Deslocamento da parte mecânica. (B) Varia- 
ção da tensão elétrica. 


8.3.1 Projeto de controle linear feedback 


O objetivo é determinar um sinal de controle U que direcione o sistema da Equa- 
ção (8.27) de qualquer estado inicial para o estado final, dado que: 


e=[r—-z] 22-2} z3—23 24-23)" (8.27) 


sendo que x* representa os estados desejados. 


Introduzindo um sinal de controle U no sistema eletromecânico: 


tj = T2 (8.28) 
z3 

to = —ajxo — ar, — azr? + Ud 212 + asas +U, 

fa = 24 

. 2 2 3 

t4 = —biz4 + boxrgr, — bgr4rj — b421 23 — bsx{ x3 + bx} 23 — br23 


+bgV — boa V + bioz? V + U2 


O controle do sistema mecânico dado por U; = uy +uj, em que uj é o controle 
feedforward e u é o controle linear feedback. O controle da parte elétrica é dado 
por: Ug = ug + u3, em que u3 é o controle feedforward e uz é o controle linear 
feedback. 


152 Sistemas dinâmicos e mecatrénicos, vol. 1 


O controle feedforward é dado por: 


4. 

2 
(l — xi) 
ii + bizi — bozijr] +bgriz] + bariz} + bss? 23 — ber? z3 + brr3 
—bsV + bart V — bor? V + U2 


t3 + air} + azri + azr? — a4 — asx, (8.29) 


E 
II 


= 
w 
Il 


Substituindo as Equações (8.27) e (8.29) no sistema da Equação (8.28), obte- 
mos a seguinte forma matricial: 


È] 0 1 0 0 € 0 0 
— - 0 0 1 0] | 
a) | or €2 +G(e,x) + um (8.30) 
Èg 0 0 0 1 e3 O O] jue 
€4 0 0 —by —b; e4 01 
em que: 
Gleg) = 
0 
-ag (er + rj) PA, aperi + as (e3 + z3)? KS a3x} re asas 


bo(e4 + 27) (e1 + xt) — b3(€4 + 27) (e1 + 27)” — ba (e1 + 27) (e3 + 23) 
—bs (e1 + at)? (e3 + 23) + bg (e1 + z$)? (e3 + 23) 
+bgV — by (e1 + zt) V + bio (e1 + z4)? V — bazia} + baria? 
+b V — by (e1 + z4) V + bio (e1 + 22)? V — boxjat + bris? 
(8.31) 


Assim, temos as matrizes A, B, Qe R: 


0 1 0 0 
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0 0 
B- 1 0 
0 0 
0 1 
1 0 0 0 
0 0,01 0 0 
= 1000 i 
Q r 0 
0 U 0 0,01 
1 
R= y 
me 


O vetor de ganho (K) do controle linear feedback da Equação (8.35) pode ser 
obtido utilizando o comando Iqr = (A,B,Q,R) do MATLAB: 


: , 3432 
dio i 6386 8,343 0 0 | (8.32) 


0 0 31,6228 4,911 


O controle linear feedback é dado por: 


u1 = —30, 6386(e1) — 8, 3432(e2) = —30,6386(x1 — 2t) — 8,3432(x3 — x3) (8.33) 


uz = —31,6228(e3) — 4,911 (e4) = —31, 6228(x3 — 2) — 4,911 (z4 — z4) (8.34) 


A variação do deslocamento e a tensão elétrica do sistema da Equação (8.28), 
considerando a utilização dos controles Uj = uy + uj e Uz = uz + us com 27 = 
0,2 * sen (t) + 2,5; 25 = 0, 2 + cos(t); x3 = 0,4 * sen(t); cj = 0,4 + cos(t), podem 


ser observadas na Figura 8.3. 


Como pode ser visto, o controle foi efetivo em manter o sistema na órbita 
desejada (aj = 0,2 * sen (t) + 2,5; 25 = 0,2+cos(t); 23 = 0,4+sen(t); zy = 
0, 4 + cos(t)). 
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Sistema Elétrico 


[— sem controle — com controle 


deslocamento [m] 


20 40 60 80 100 
tempo [s] tempo [s} 


Figura 8.4: Sistema eletromecanico com controle. (A) Deslocamento da parte mecânica. 
(B) Variação da tensão elétrica. 


8.4 Controle de estados dependentes da equação de 
Riccati (SDRE) 


A estratégia SDRE (State Dependent Riccati Equation) se tornou muito popu- 
lar dentro da comunidade de controle na última década. Este método, proposto 
inicialmente por Pearson (1962) e posteriormente expandido por Wernli e Cook 
(1975), foi independentemente estudado por Mracek e Cloutier (1998) e expan- 
dido por Friedland (1996). O método SDRE envolve a fatoração (isto é, parame- 
trização) da dinâmica não linear no vetor de estado e o produto de uma função 


com valor de matriz que depende do próprio estado. 


A proposta de controlador SDRE utiliza-se do método do controle LQR para 
encontrar o ganho ótimo para o controle. A aplicação do controlador SDRE faz- 
se necessária quando as características do sistema são não lineares e variantes no 
tempo. 

O problema de controle ótimo para um sistema com os coeficientes da matriz 


de estado, dependente do estado em horizonte infinito, pode ser formulado da 


seguinte forma (MRACEK; CLOUTIER, 1998 apud MOLTER 2008): 
1 o 
J = F x? Q(x)x + u’ R(x)udt (8.35) 
0 


em relação ao estado x e ao controle u, sujeito ao sistema de restrições não 


lineares: 
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x = f(x) + B(z)u (8.36) 


sendo x € R” e u € R™. Q(x) E R"*" e R(x) € R"*" são matrizes definidas 
positivas. 

A aproximação pelas equações SDRE para resolver o problema de controle 
subótimo das Equações (8.32) e (8.36) é dada pela parametrização direta, para 
transformar a dinâmica não linear do estado em matrizes de coeficientes do estado 


(SDC): 


x = A(z)x + B(x)u (8.37) 


em que A(z) = u. 

Em geral, a escolha da parametrização não é única, apenas nos casos em que x 
é escalar (BANKS et al., 2007). Essa escolha deve ser feita de forma apropriada, 
de acordo com o sistema de controle de interesse. Um fator importante é não 
violar a controlabilidade do sistema, ou seja, a matriz de controlabilidade depende 
de o estado da Equação (8.38) ter posto n: 


M = [B(x) A(x)B(x) L A(x)""'B(x)] (8.38) 


Considerando que as matrizes x € R” eu € R™ sejam definidas positivas e 
o posto da matriz de controlabilidade da Equação (8.38) seja n, o controle não 
linear de retroalimentação dependente dos estados é definido pela Equação (8.39): 


u = R~'B(x)? P(x)x (8.39) 


em que a solução do sistema depende da matriz P(x)x e é dada por: 


A(x)’ P(x) + P(x)A(x) — P(x)B(x)R(x)~'B(x)’ P(x) + Q(x) =0 (8.40) 


A técnica de controle SDRE com o controle subótimo da Equação (8.39) segue 


os seguinte procedimentos: 


Passo 1: Escrever o sistema na forma parametrizada da Equação (8.37) com os 
coeficientes dependentes dos estados. 
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Passo 2: Definir x(0) = xo, para que o posto da matriz da Equação (8.38) seja 


n. 

Passo 3: Definir Q(x) e R(x). 

Passo 4: Resolver a Equação (8.37) para o estado x(t). 

Passo 5: Calcular o sinal de controle da Equação (8.39). 

Passo 6: Integrar a Equação (8.37) e atualizar o estado do sistema x(t). 

Passo 7: Calcular o posto da Equação (8.38), se posto = n voltar para o passo 
3. Se posto < n, utilizar a ultima matriz controlável obtida, e voltar para 


o passo 3. 


A proposta de estratégia de controle SDRE pode ser vista na forma de dia- 


grama de blocos na Figura 8.5. 


Figura 8.5: Diagrama do controle SDRE. 


Optou-se por incluir no diagrama uma função de saturação do controlador, 
para o caso em que há limitações físicas do atuador. 
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8.5 Aplicação do controle SDRE 


Conforme Alleyne e Hedrick (1992) e Karlsson et al. (2000), sistemas físicos 
reais incluem em sua dinâmica componentes não lineares que devem ser levados 
em consideração; as características dinâmicas dos componentes da suspensão são 
não lineares, e amortecedores e molas têm propriedades de não linearidade. 

Em várias pesquisas sobre suspensão veicular tem-se a contribuição de mo- 
delos lineares e modelos linearizados pelas séries de Taylor em torno dos pontos 
de equilíbrio estático, considerando o deslocamento da carroceria, do eixo e da 
roda. Mas, poucas pesquisas têm considerado o modelo na forma não linear para 
determinar o controle da suspensão (ALLEYNE; HEDRICK, 1992; BUCKNER 
et al., 2000). 


8.6 Modelo matemático não linear 


A determinação de um modelo quarter-car consiste em isolar um quarto do veí- 
culo e estudar separadamente esta seção. Para veículos com peso igualmente 
distribuído, os resultados são muito próximos do modelo completo. Geralmente, 
os modelos de um quarto de veículo têm apenas 2 graus de liberdade, sendo estes 
os deslocamentos verticais da massa suspensa e da massa não suspensa. 

Conforme Chantranuwathana e Peng (2004), a utilização de modelo quarter- 
car justifica-se pelo fato de mostrar claramente o deslocamento da carroceria e 
da roda e as relações entre o sistema e a estratégia de controle proposta, pos- 
sibilitando estudar a correlação entre conforto, segurança e sistema de controle. 
Por esse motivo, a maioria dos trabalhos sobre aplicação de controle em sistemas 
veiculares utiliza esse modelo. 

O modelo de suspensão com 2 graus de liberdade para representações deno- 
minadas quarter-car pode ser observado na Figura 8.6. Como descrito anterior- 
mente, o modelo consiste em isolar um quarto do veículo e estudar separadamente 
esta seção. Esse modelo é composto por uma massa suspensa que representa a 
carroceria do veículo e uma massa não suspensa que representa o conjunto eixo- 
roda. Essas massas são conectadas pela mola e pelo amortecedor. O contato do 
veículo com a pista é feito pelo pneu. O sistema é excitado pelas irregularidades 
da pista de amplitude zxr. 
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Na Figura 8.6, ms representa a massa da carroceria, my a massa do eixo 
da roda, b, o amortecedor passivo de uma estrutura convencional, k, o feixe de 
molas, ką o pneu como um feixe de molas (movimentos verticais do pneu), £p 
os movimentos verticais da roda e x,, os movimentos verticais da carroceria. A 
força F representa a atuação de um dispositivo com características dinâmicas, 
como um amortecedor ativo ou semiativo em substituição ou em conjunto com 


um amortecedor passivo bs (D'AZZO; HOUPIS, 1975). 


Figura 8.6: Modelo de suspensão para quarter-car. 


O diagrama de corpo livre pode ser formulado conforme ilustram as Figuras 
8.6 e 8.8, considerando como ponto de referência de coordenadas a posição do 
eixo da roda £w, em que ks(£w— Ze) representa a força na mola e no amortecedor, 
bs(£w — £e) à força devida à rigidez dos pneus, kt(£w — £r) a aceleração da massa 
da carroceria ms, Ty a aceleração da massa do eixo e da roda My e F a força 
do atuador. Os deslocamentos e a velocidade dos elementos de suspensão são 
dados pelo movimento relativo entre os corpos e a pista. Assim, o deslocamento 
relativo da mola é dado pela diferença entre os deslocamentos verticais do eixo e 
da roda e a massa da carroceria (£w — Ze), à velocidade do amortecedor é dada 
pela diferença entre as velocidades dessas massas (tw — te) e o deslocamento 
relativo do pneu é dado pela diferença entre o deslocamento vertical da massa 
do eixo e da roda e a amplitude da pista (£w — £e). De acordo com a segunda 
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lei de Newton, na condição de equilíbrio estático, deduzem-se as equações do 


movimento para o modelo quarter-car: 


Figura 8.7: Diagrama de corpo livre para a massa ms. 


k (Xp %,) 


k (x 


t wo Xp) 


Figura 8.8: Diagrama de corpo livre para a massa m,,. 


Aplicando a segunda lei de Newton, 5 F = ma, em cada massa separada- 
mente, o sistema de força para o modelo quarter-car da Figura 8.3 pode ser 


representado por: 


msie = b(£w — te) + k(Zy — Lo) — F (8.41) 
Mulw = —bs(Zy — Te) — ks(tw — Te) — kt(tw — Tr) + F 


O sistema da Equação (8.39) representa o modelo na forma linear. Conforme 
Gaspar et al. (2003), o amortecedor hidráulico e a mola têm componentes li- 
neares e não lineares. As molas podem ser lineares ou não lineares. As molas 
consideradas lineares obedecem à lei de Hooke, ou seja, apresentam uma defor- 
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mação proporcional ao carregamento que sofrem. Já as molas não lineares não 
apresentam tal característica. 


Conforme Rill (2003), nas aplicações reais, para evitar choques nos batentes, o 
valor do coeficiente de rigidez da mola cresce exponencialmente conforme se afasta 
do ponto de equilíbrio estático. Com o objetivo de incorporar essa característica 
ao modelo, propõe-se considerar a força da mola ks(£w — £e) na seguinte forma: 


ka(Zw — Ze) = (ay — To) + k” (ty — ze)? (8.42) 


em que o coeficiente kl representa a faixa de atuação linear e o coeficiente k?! não 
linear representaria a característica não linear da mola observada em situações 
reais (RILL, 2003). 


Substituindo a Equação (8.42) na Equação (8.43), obtêm-se as seguintes equa- 
ções diferenciais de segunda ordem, que representam a dinâmica de um sistema 
de suspensão ativa não linear (GASPAR et al., 2003): 


Mso = k(xy— Lo) + ke (tw — ze) +b (iw — te) — F (8.43) 


Muw = —ki (Ew — 2c) + ke (£u — 2e)? + Ob (dw — te) — ke(tw — tr) — F 


A variável x, representa o deslocamento vertical da massa ms, te a velocidade 
de deslocamento da massa ms e ïe a aceleração do deslocamento da massa ms. 
A variável 7, representa o deslocamento vertical da massa Mu, tw a velocidade 


de deslocamento da massa My € Ëw a aceleração do deslocamento da massa my. 

Realizando as seguintes substituições: 74 = £e; T2 = Le; T3 = Lyi L4 = Tw: 
Ëw = t4; Ëe = t2; W = Tr; U = F, o sistema da Equação (8.41) pode ser 
representado na forma de espaço de estados: 


= ty (8.44) 
kl b! k! nl 1 

to = —— 2 — 22+ — 23 + — (T3 — 21)” — —u 
Ms Ms Ms s s 

da = T4 
k! b! ki +k b! kel 1 

xa = E. db A A Mb NE to gs Mg ts 
Mu Mu Mu My Mau Mu Mau 
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Para analisar a dinâmica do sistema e comparar os resultados do sistema pas- 
sivo e do controle proposto às simulações realizadas nesta seção, consideremos a 
entrada tipo degrau com 0,1 m de amplitude. A utilização de tal sinal possibi- 
litará a comparação entre a resposta do sistema passivo e o sistema semiativo. 
Conforme Moura (2003), sistemas projetados considerando tal entrada de teste 
fornecem normalmente um desempenho satisfatório a entradas reais. 


Para as simulações computacionais serão utilizados os valores da Tabela 8.1, 
adaptados de Gaspar et al. (2003) e Tusset (2008). 


Tabela 8.1: Valores dos parâmetros 


Ms Mu b bri 
290 kg 40 kg 700 Ns/m 200 Ns/m 
bg kl kn ky 


s 
400 Ns/m 235,10? Ns/m 235,10! Ns/m 190, 10° Ns/m 


Os parâmetros da suspensão foram escolhidos de forma a obter uma frequência 
natural em torno de 2 Hz para m, e de 12 Hz para Mu, frequências próximas às 
utilizadas para simulações de suspensão automobilística (PINHEIRO, 2004). 

Na Figura 8.9 são apresentados os deslocamentos do chassi e do eixo da roda 


para o caso em que a suspensão não tem forças adicionais às da mola e do amor- 
tecedor. 


né Deslocamento do Chassi axe Deslocamento do eixo da roda 

E015 E 
© o 01 
É os f 
o S 
3 2 0.05 
8005 8 

0 0 

0 2 4 6 8 10 0 2 4 E = 10 
tempo [s] tempo [s] 


Figura 8.9: Deslocamento para uma entrada degrau (w = 0,1 m). (A) Deslocamento 
do chassi. (B) Deslocamento do eixo da roda. 


Considerando o sistema da Equação (8.44) na seguinte configuração: 
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X = A(X)X + g(X) + Bu (8.45) 
em que: 
0 1 0 0 
L nl ar q nl 
ia — A: — gi x3 — Be? = = 4 E72 + 382 3? = 
0 0 0 1 
Am pri b (ki +k ) ke! kr! b 
da + 32-73 + E] May — — = o — 32-17] E 
Tı 
E=|" 
T3 
T4 
0 
ov e, 
B=| me 
0 
E e 
Mu 
e 
0 
0 
x = 
0 
k 
ma 


Na Figura 8.10 são apresentados os deslocamentos do chassi e do eixo da 
roda para o caso em que a suspensão tem forças (F) adicionais às da mola e do 
amortecedor. E os valores das matrizes Q e R para aplicação do controle são: 


100 0 0 0 
| 10 6 BD 

x) = 10º 
Q (x) 0 0 100 
ce @ 8 


e 
R (x) = 107! 


Controle ótimo para sistemas não lineares 163 


Deslocamento do Chassi fi Deslocamento do eixo da roda 
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Figura 8.10: Deslocamento para uma entrada degrau (w = 0,1 m) considerando a 
inclusão do controle SDRE. (A) Deslocamento do chassi. (B) Deslocamento do eixo da 
roda. 


Capitulo 9 


Controle de processo 


9.1 Introdução 


Neste capitulo será apresentado o controle do reator de um processo da indústria 


química, mais especificamente, a fermentação alcoólica, 


9.2 Processo de fermentação alcoólica 


O principal equipamento no processo de fermentação alcoólica é o reator, pois 
nele ocorrem as transformações bioquímicas para a obtenção do produto final da 
fermentação, o álcool, sendo que para ocorrer a transformação da matéria-prima 
em álcool utilizam-se microrganismos, mais comumente as leveduras da espécie 
Saccharomyces cerevisiae. As etapas do processo fermentativo alimentado, o mais 


utilizado nas destilarias do Brasil, são as seguintes: 


e O mosto é alimentado na dorna de fermentação, onde se encontra a suspen- 


são de levedura. 


e O processo fermentativo do mosto ocorre durante a alimentação da dorna 


e continua até se completar a conversão dos açúcares. 
e O vinho segue para um processo de separação vinho-levedura. 


e A levedura é recuperada e tratada (água e adição de ácido) e, posterior- 


mente, retorna ao reator para nova fermentação. 


165 
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9.3 Modelo matemático do reator 


Um esquema do fermentador é indicado na Figura 9.1. 


Tins Com Fi 
Fag, Tag 
— (os 5 
Fag, no s 
Tinag od 


Cs, Cx Cp Coz, Th Fe 


Figura 9.1: Representação do fermentador contínuo. 


Na vazão de entrada tem-se a concentração de açúcar ou substrato (Csin), 
a temperatura (Tin) e a vazão (Fin). Nas condições adequadas de concentração 
inicial de matéria-prima e microrganismo no fermentador, as leveduras se repro- 
duzem e produzem etanol. A concentração de microrganismo, Equação (9.1), 
varia com a taxa de crescimento das leveduras e a quantidade de microrganismos 
que saem do sistema. 
dC, _ C Cs 
E PRA 


Uma parte do açúcar da alimentação é usada pelas leveduras para o seu 


e Kn — TiC: (9.1) 


crescimento. Quando a taxa de multiplicação de leveduras é igual à quantidade 
de leveduras que saem do reator, temos uma concentração constante de leveduras. 
A variação da concentração também depende do crescimento específico máximo 


Hx, Equação (9.2), que varia com a temperatura: 


E E 
| pii. 
ly = Aje ”Tr+273) — Age R(UTr +273) (9.2) 


O crescimento específico máximo mostra a taxa de crescimento e de morte de 
leveduras com o tempo. Essa relação mostra a quantidade máxima de leveduras 
que crescem a uma determinada temperatura. 


Controle de processo 167 


A quantidade de açúcar dentro do reator, Equação (9.3), depende da quan- 
tidade de açúcar que entra e da taxa de consumo desse substrato pela levedura, 
tanto para a produção de etanol quanto para a reprodução das leveduras: 


dCs 1 Cs Ke 1 Ds dus Bim, Fs 
dt = Ras DA K, F C,° Rte Ka + E IP V Cain V Cs 
(9.3) 


O ideal seria que as leveduras consumissem todo o açúcar, porém, em virtude de 
o sistema ser contínuo, as leveduras não têm tempo hábil para fermentar todo o 
açúcar, sobrando assim uma quantidade que sai do reator sem ser fermentado. 
A produção de etanol depende do consumo de açúcar pelas leveduras no re- 
ator. A variação na concentração de etanol no reator é relacionada na Equação 
(9.4), sendo essa concentração a quantidade de etanol produzida menos a quan- 


tidade de etanol que sai: 


dC, 
dt 


Ci 
ks 


A concentração de oxigênio dissolvido no reator, Equação (9.5), depende da 


Fe 


= flpCr— + Coe Kor — — (9.4) 


quantidade de oxigénio do ar que se difunde para o reator e da quantidade de 


oxigênio que é consumida: 


dCo 


02 = ka(CS, — Cos) (9.5) 


em que kja é o coeficiente volumétrico de transferência de massa, Equação (9.6), 
que é dependente da temperatura, e kao é o valor desse coeficiente para tempe- 


ratura constante: 


kia = kao(1,024)7—20 (9.6) 


A quantidade de oxigênio que se difunde depende da diferença entre a con- 
centração de oxigênio no equilíbrio, Equação (9.7), e a concentração de oxigênio 


no reator. 
Co, = (14,6 — 0,3943T; + 0,00714T2 — 0, 000064672) 10- 2 4 (9.7) 


Já a quantidade de oxigênio em equilíbrio no reator depende da temperatura 
e do coeficiente global de forças iônicas, — 5º H;li;, que é dado pela Equação (9.8): 
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mnact Mna MCaCOs Mca 
Ay, = 0.5Hn —— + 2Hca ——— — 9.8 
pa il; Na A Naci V Ca MCaCOs V ( ) 


MMgC Mm, MNaCl , oMmycto \ Mei 
2H yo ——— — + 0.577, ———— | —— 
Mg Mmugch V K Ct À Mwact Myc} V 


-— 


Mcaco; Mcos 


+ 0,5H 10 PH + 0,5Hoy 100M-pH) 
Mcacos V H , SLIOH 


+ 


2H, CO; 


Como o volume e o pH são constantes, o coeficiente global de forças iônicas é 
constante e vale 0, 1227. Esse valor é adimensional. A Equação (9.9) relaciona o 


consumo de oxigênio pela levedura durante a sua fermentação: 


= 1 Co, 
TO. = HO; Yo, Cr TOR (9.9) 


Além do balanço de massa, precisamos do balanço de energia para descrever o 
comportamento da temperatura do fermentador e da jaqueta de refrigeração. O 
fluido utilizado para refrigerar o reator neste trabalho será água com temperatura 
de 15°C. O balanço de energia é composto apenas por duas equações: variação 
de temperatura do reator, Equação (9.10), e variação de temperatura na jaqueta, 
Equação (9.11). 

aT, _ Fi 


= Tm +273) — E; +273) + 


"ar ro, AH, = KrAr(T. Ei Tag) 
dt V 


9.10 
32Pr Cheat r Vpr Cheat,r ( ) 


sendo o valor da constante 273 válido apenas para conversão da temperatura de 
Celsius para Kelvin, mantendo sempre as mesmas unidades de medida, e o calor 


de reação AH, considerado constante. 


dt 


Kr Ar(T; E Tag) 
Vj PagCheat,ag 


F, 
= y (Taag = Tag) + (9.11) 
J 


O modelo dinâmico utilizado na investigação do comportamento dinâmico do 
biorreator para fermentação e produção de etanol pode ser representado resumi- 
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damente pelas Equações (9.12): 


sige of aie mes E Os (9.12) 
+ TCs - Os 
Eta = kia (Cb, — Co) — ro 
aD = (Tin + 273) — “eT, +273) + aoa da ae 


A Tabela 9.1 apresenta os valores dos parâmetros utilizados nas simulações 
numéricas. 


Tabela 9.1: Parâmetros utilizados nas simulações numéricas 


Constantes do modelo matemático do fermentador 


A; = 9,5 x 10º Hy = —0, 774 

Ag = 2,55 x 10° Hg = —0,314 

Ar =1m H'na = —0, 550 
Cheat,ag -— 4, 18 J/gk Hon = 0,941 
Cheat,r = 4,18 J/gK MCacos = 100 gm 
Ea, = 55000 J/mol MMgCl = 100 gm 
Ea, = 220000 J/mol MNact = 500 gm 
(kja)o = 38 bh Mea = 40 g/mol 

K, = 1,03 g/l Mcacos = 90 g/mol 
Ks, = 1,68 g/l Ma = 35,5 g/mol 
Kr = 3,6 x 10° J/hm?K Mco, = 60 g/mol 
R= 8,31 J/molK Yo, = 0,97 mg/mg 
Rsp = 0,435 AH, = 518 kJ/mol Os 
Rsx = 0,607 Ho, = 0,5 ho! 

Hc, = —0, 303 pep = 1,79 ho! 

Hei = 0,844 Pag = 1000 g/l 


Heo, = 0,485 pr 1080 g/1 
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9.4 Sistemas de controle 


Um processo é um conjunto de mudanças que ocorrem em uma entrada com o fim 
de transformá-la em uma saída específica, o que pode acontecer de forma natural 
ou artificial. A definição de processo está representada de forma visual na Figura 
9.2. 


Entrada e ——— — » Saida 


Figura 9.2: Representação em malha aberto do sistema. 


Se os processos operassem em estado estacionário, ou seja, se todas as variáveis 
de entrada fossem constantes, as saídas permaneceriam constantes e o sistema 
poderia operar sem supervisão ou controle. Entretanto, na prática essa operação 
é influenciada por fatores externos que alteram essas condições, logo, é necessário 
um sistema de controle para manter o processo em seu funcionamento ideal. 

Um sistema em malha aberta é um sistema em que o sinal de saída do processo 
não afeta a ação do controlador, assim, as varáveis de saída não são medidas, 
ou, quando não há um sistema de controle para o processo, a Figura 9.2 pode 
representar um processo em malha aberta. No sistema em malha fechada, o sinal 
de saída é medido e comparado com o valor desejado, o setpoint do sistema. O 
erro gerado por essa comparação age no controlador para corrigir o valor de saída 
e trazê-lo para o setpoint. A Figura 9.3 representa um sistema em malha fechada. 


[sm (74 femea ef} fre} aE] 


+ 


Figura 9.3: Sistema de controle em malha fechada. 


9.5 Controladores 


Dentre os controladores mais utilizados na indústria, podem-se citar os con- 
troles do tipo SISO (Single-In Single-Out), ou seja, uma entrada e uma saída, 
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sendo os mais comuns: controlador liga-desliga (on-off); controlador proporcional 
(P); controlador proporcional-integral (PT); e controlador proporcional-tntegral- 
derivativo (PID). 


9.5.1 Controlador liga-desliga (on-off) 


O controlador on-off é um controlador de funcionamento simples. Seu elemento 
de atuação possui duas funções: liga e desliga. Quando o erro do sistema é maior 
que 0, o atuador age de uma forma; quando é menor que zero, o atuador age de 
outra. Dessa forma, U(t) pode ser descrito da seguinte forma: Ui(t) para e(t) > 0 
e Ua(t), para e(t) < 0. 


9.5.2 Controlador proporcional (P) 


O controlador proporcional, Equação (9.13), gera uma resposta U (t) proporcional 
ao erro e(t); quanto maior for o valor do ganho proporcional (Ac), maior será a 


sensibilidade do sinal de atuação aos erros. 


U(t) = Kpe(t) (9.13) 


O controlador proporcional geralmente não atinge o valor de setpoint, tendo 
uma pequena diferença chamada de offset. Em processos mais simples, como 


controle de volume de um tanque, essa diferença é pouco significativa. 


9.5.3 Controlador proporcional-integral (PI) 


O controlador proporcional-integral é um sistema de controle que possui um termo 
proporcional ao erro e outro integral. A resposta para esse controlador é dada 
pela Equação (9.14), em que Kp representa o ganho proporcional e Tia a taxa de 
restabelecimento. 


»” 


t 
U(t) = Kye(t) + z | e(t)dt (9.14) 


A taxa de restabelecimento é o número de vezes por minuto em que o ganho 
proporcional é duplicado. O termo integral adicionado ao controlador corrige o 
offset que o controlador proporcional apresenta, o que gera uma resposta lenta 
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e um sinal de correção oscilatório, podendo dificultar a estabilização do processo 


no setpoint. 


9.5.4 Controlador proporcional-integral-derivativo (PID) 


A adição do termo derivativo no controlador PI gera o controlador PID, Equação 
(9.15). A ação derivativa diminui a oscilação do sistema e acelera a ação do 
controlador. 


” 


U(t) = Kpe(t) + a [ea 4 K TL 


dt 


O termo T; é chamado de tempo derivativo, e significa o intervalo de tempo 


(9.15) 


em que a ação do termo derivativo avança o controlador. 


9.6 Controle LQR 


O controlador LQR (Linear-Quadratic Regulator) é uma estratégia de controle 
para sistemas lineares que proporciona estabilidade e um controle ótimo. O sinal 
de controle é obtido resolvendo-se a equação de Ricatti para matrizes de desem- 
penho e custo Q e R definidas positivas. A obtenção do ganho de controle pela 
equação de Ricatti garante a minimização de um índice de desempenho quadrá- 
tico. 

A Figura 9.4 apresenta o diagrama de blocos de um sistema de com controle 


por realimentação de estados. 
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Figura 9.4: Sistema por realimentação de estados. 


9.6.1 Aplicação 
Para aplicar o sistema de controle LQR é necessário que o sistema esteja repre- 
sentado na forma de equações de estado, conforme Equação (9.16). 
X = AX + BU (9.16) 
O controle por realimentação de estados U do sistema da Equação (9.16) é 
dada pela Equação (9.17): 
U = -R-'BPX = -KX (9.17) 
O indice de desempenho J a ser minimizado é representado pela Equação 
(9.18): 
o0 
jë f (x"Qx + UTRU) dt (9.18) 
0 


em que J representa o indice de desempenho do controlador. 
A matriz P da Equação (9.17) pode ser obtida resolvendo-se a equação de 
Riccati: 
PA+P'P-PBR!B!ÍP+Q=0 (9.19) 


em que R e Q são matrizes definidas positivas. 


9.6.2 Estratégias de controle para reator de malha aberta 


Os sistemas em malha aberta são mais simples e mais baratos. Nesses sistemas 
o sinal de saída não é medido e a atuação do controle é simplificada. No caso 
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do reator em malha aberta, para controlar a temperatura da jaqueta usa-se uma 
vazão constante de 20 L/h. Os resultados obtidos sobre a concentração de mi- 
crorganismos, oxigênio, glicose e etanol em função do tempo no reator em malha 
aberta estão indicados nas Figuras 9.5 e 9.6. 


Concentratição 


Tempo (h) Tempo h) 


Figura 9.5: Concentrações de saída obtidas em malha de controle aberta. 


Reator 


Camisa do Reator 


Figura 9.6: Comportamento das temperaturas do reator e da camisa refrigerada. 


Pode-se notar que o fermentador levou aproximadamente 100 horas para es- 
tabilizar e manter uma saída constante de produto. Verifica-se também que o 
crescimento das leveduras e de álcool é proporcional ao consumo de açúcar e de 
oxigênio, ou seja, quanto mais leveduras e etanol estão presentes no reator, menor 
a quantidade de açúcar e oxigênio. 

A temperatura ideal para a fermentação alcoólica do Saccharomyces cerevi- 
siae é de 32 °C. A temperatura de estabilização do reator fica próxima dos 39 
°C, mas a partir dos 36 °C as proteínas do Saccharomyces cerevisiae podem co- 
meçar a desnaturar e, para se proteger, os microrganismos produzem glicerol, um 
subproduto indesejado. Dessa forma, pelo tempo que o sistema demora para se 
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estabilizar e pela temperatura em que o sistema se estabiliza, é necessário um 


sistema de controle de temperatura 


9.6.3 Projeto do controlador LQR 


Consideremos a Equação (9.12) na forma de equações no espaço de estado: 


X = AX + BU (9.20) 


Sendo condição necessária que a matriz A seja controlável, seu critério de 
controlabilidade é dado pela matriz M, Equação (9.21). Quando M for uma 
matriz quadrada de ordem igual ao número de equações diferenciais, neste caso 
6, a matriz A é controlável. 


=[B AB ...A"-'B] (9.21) 


Considerando a introdução de um sinal de controle U (t) na Equação (9.12), o 


controle do sistema pela temperatura do reator pode ser representado na seguinte 


forma: 
dio) a pele dio , (9.22) 
+ A Osin teo, 
Mo) = bia (OB — Con) ros 
au . paso +273) 4 gene Aw 


em que U(t) representa o sinal de controle. 

Considerando que o controle de temperatura seja o objetivo principal, pode-se 
simplificar o sistema com controle da Equação (9.22) para apenas as equações do 
balanço de energia, por elas serem as mais influentes na temperatura do reator. 
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- F _ KrAy Bac. 
Tr = S V V prCheat,r V pr “heat r Ty + (9 23) 
id KrAr a KrAr P 
g VjPagCheat,ag VjPagCheat,ag ag 
0 
+ | RE, E 
Vj 
Assim, as matrizes A, B, X e M se tornam: 
ah — _ par. —KrAy 
A — Y iy vente (9.24) 
ape Rep E PER o PTEN 
B y (9.25) 
= Tinag Tas a 
J 
T, 
X= | r | (9.26) 
Tag 
e 
M = [BAB] (9.27) 


Considerando a linearização em torno das condições iniciais obtém-se: 


_ | —0,130745 0,079745 (9.28) 

1,722  —1,7225 

0 
do 9.29 
re (9.29) 
e define-se: 
91,7 0,35 

= 198 | 9 9.30 
Q por pi | on 
R= 1 | (9.31) 


Resolvendo-se a equação de Riccati, Equação (9.19), obtém-se o ganho de 
controle K: 
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K = [—673071,309 — 2736, 7135] (9.32) 


Assim, o sinal de realimentação de estados é o valor da vazão de água na 
jaqueta de resfriamento (Fag), descrita pela Equação (9.33): 


Fag = U (t) = 673071, 309(T; — T$) + 2736, 7135(Tug — Tag) (9.33) 


em que Tý é o setpoint da temperatura do reator e vale 32 °C e Tj, é O setpoint 


da temperatura da jaqueta de fermentação e vale 24 °C. O valor do setpoint 
da jaqueta foi definido de forma arbitrária. Na Figura 9.7 são apresentadas as 


variações nas concentrações de microrganismo e de açúcar. 


Tempo (h) 


Figura 9.7: Concentrações de saída obtidas em malha de controle fechada. 


Pode-se notar que o comportamento de consumo de oxigênio e açúcar perma- 
nece o mesmo em relação ao crescimento de leveduras e ao aumento na quantidade 
de produtos. Mesmo que a quantidade de etanol produzida com o sistema em 
malha fechada seja menor que no modelo com sistema em malha aberta, pode-se 
afirmar que a produção de etanol em 32 °C é a desejada. 


As Figuras 9.8 relacionam respectivamente a temperatura do reator e a tem- 
peratura da jaqueta à vazão do líquido refrigerante na jaqueta. Como pode se 
observar, no início, quando o reator precisa esquentar, a vazão de fluido refrige- 
rante é zero, em seguida ela cresce para resfriar o fermentador. 
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Tespentura do Werke 
pri 


Temendo da Janet (7) 


ta) (b) 


Vazão do dads Refrigurato 
(Lh) 


Figura 9.8: Concentrações de saída obtidas em malha de controle fechada. 


Capitulo 10 


Controle robusto H» e 


polynomial chaos 


10.1 Introdução 


Neste capítulo, apresentamos uma introdução aos conceitos matemáticos funda- 
mentais de controle robusto H» e às aplicações de polynomial chaos na análise 
de robustez de sistemas dinâmicos. O foco do capítulo está em apresentar dida- 
ticamente os conceitos mais básicos, de forma clara, servindo como complemento 
para textos mais completos com foco no projeto, que é eminentemente compu- 
tacional. Diversos excelentes textos introdutórios estão disponíveis na literatura, 
mas na maioria deles há uma preponderante preocupação com o formalismo ma- 
temático, às vezes sem muita clareza na apresentação dos conceitos. Da mesma 
forma, o projeto de controle robusto é feito quase que completamente por meio 
de programas especializados, como o MATLAB, e existem excelentes textos com 
este foco. Este capítulo então deve ser lido como coadjuvante a um desses textos, 


na tentativa de deixar mais claros estes conceitos. 


No controle clássico, dado o modelo matemático da planta (considerada linear 
e invariante no tempo, ou LIT), que é a função de transferência G(s), o objetivo é 
projetar um controlador H (s) de maneira que o sistema em malha fechada (MF), 
conforme apresentado na Figura 10.1, seja estável e atenda às especificações de 
desempenho, normalmente dadas sobre o erro teórico de seguimento de referência 
Ei(s) = R(s) — Y(s). 
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Figura 10.1: Diagrama de blocos de um sistema de controle 


O modelo da planta, levantado nos processos de modelagem ou identificação 
de sistemas, é usado explícita ou implicitamente no projeto do controlador por 
técnicas essencialmente gráficas. Entretanto, para um correto funcionamento do 
sistema na prática, é necessário que ele tenha robustez, um conceito que normal- 
mente não é abordado nos cursos introdutórios. Também nos cursos de controle 
clássico, esse conceito é pouco tratado, sendo mencionado como um requisito a 
ser imposto nas margens de ganho e de fase. 

Robustez significa, de maneira geral, capacidade do sistema de manter o seu 
funcionamento adequado em ambiente adverso. No contexto de controle robusto, 
entretanto, uma definição mais precisa é necessária. Definem-se então dois concei- 
tos de robustez relacionados: robustez de estabilidade, que significa a capacidade 
do sistema de manter a estabilidade mediante incertezas no modelo da planta, e 
robustez de desempenho, que significa a capacidade do sistema de manter o mesmo 
desempenho mediante incertezas no modelo da planta. Essas incertezas podem 
advir de diversas fontes, como uma modelagem imperfeita (ou seja, há conside- 
rável incerteza no modelo da planta utilizado para o projeto), um processo de 
linearização (em que os termos de grau maior na série de Taylor do modelo são 
desprezados) ou uma variação no tempo (ou seja, o modelo matemático depende 
explicitamente do tempo). 

Controle robusto vem se desenvolvendo ao longo das últimas décadas e atual- 
mente já abarca uma ampla gama de classes de sistemas, dos lineares mais simples 
até os não lineares e estocásticos. À teoria que será apresentada aqui, que está 
bem desenvolvida e consolidada, é a teoria de controle Hx (H infinito), em que se 
assume que o sistema a ser controlado é linear e invariante no tempo (com exce- 
ção das incertezas). Há várias vantagens que podem ser citadas sobre essa teoria 
se compararmos com o controle clássico, dentre elas: 1) formalização precisa do 
conceito de robustez; 2) funciona tanto para sistemas com uma entrada e uma 
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saída (SISO) como com múltiplas entradas e múltiplas saídas (MIMO): 3) para 
quem já conhece controle clássico, muitos conceitos são estendidos naturalmente. 

Uma desvantagem da teoria Hx é que sua extensão para sistemas não line- 
ares, da forma como está hoje, é difícil de ser utilizada. Uma técnica de análise 
de robustez que funciona também para sistemas não lineares e vem ganhando 
notoriedade nos últimos anos é a do polynomial chaos, que, apesar de ser de na- 
tureza estocástica, pode ser implementada computacionalmente. Diferentemente 
da técnica de Monte Carlo, que consiste somente de amostragem e simulação, 
o polynomial chaos apresenta uma versão intrusiva, que implica construir outro 
sistema a partir do que está sendo simulado, com a amostragem relegada somente 
para o final do processo com o intuito de obter alguns parâmetros estatísticos, e 
outra versão não intrusiva, que necessita de amostragem, mas em menor quanti- 
dade que o Monte Carlo. 

Finalmente, já estão em desenvolvimento técnicas de projeto de controladores 
a partir do polynomial chaos, mas que não serão apresentadas aqui por falta de 
espaço. Então, a parte inicial do capítulo se propõe a apresentar os conceitos bá- 
sicos de controle robusto Hæ e a parte final aborda a teoria básica do polynomial 
chaos. 


10.2 Diagrama de blocos e sinais 


Todo sistema de controle LIT em MF pode ser representado por um diagrama 
de blocos, como na Figura 10.2. O modelo da planta é representado pela matriz 
de funções de transferência G(s), o controlador é representado por H(s) e F(s) 
normalmente representa a dinâmica dos sensores. Y(s) é a transformada de 
Laplace dos vetores (sinais) de saída (ou variáveis controladas), que são medidos 
pelos sensores, D(s) é o vetor de distúrbios, E(s) é o vetor de erros, R(s) é o 
vetor de referência e N(s) é o vetor de ruído e erros de medida. 

A entrada de G(s) normalmente é representada por U(s) e conhecida como 
vetor de controle. O vetor de sinais de distúrbios D(s) representa todo sinal 
externo ao sistema (ambiental) que afeta o seu funcionamento, mas que não pode 
ser modificado (porém é possível medi-lo). O modelo da planta G(s) já inclui os 
modelos dos atuadores e, frequentemente, também o modelo dos sensores, sendo 
que nesse último caso podemos assumir F(s) = J (matriz identidade). 
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Figura 10.2: Diagrama de blocos normalmente usado em controle robusto. 


A tarefa clássica do controlador H(s) é calcular, em tempo real e durante o 
funcionamento do sistema, um sinal de controle U(s) que estabilize o sistema em 
MF, para qualquer que seja o seu estado inicial, além de fazer com que o sinal de 
saída Y(s) siga "de perto"o sinal de referência R(s), segundo algum critério de 
desempenho. A tarefa do projetista de controle é chegar a um controlador H (s) 
que atenda a esses requisitos e, para tanto, informações sobre G(s) são implici- 
tamente utilizadas durante o projeto, embutidas na técnica utilizada. Podemos 
dizer então que H(s) utiliza a leitura dos sensores Y(s), bem como informações 


sobre o modelo G(s) que estão armazenadas nele, em certo sentido. 


As técnicas clássicas de projeto normalmente envolvem impor posições aos po- 
los e zeros (lugar geométrico das raízes) ou formatos específicos dos diagramas de 
Bode da função de transferência em malha aberta L(s) = G(s)H(s) (métodos de 
resposta em frequência). As técnicas de projeto de controle robusto generalizam a 
ideia do projeto clássico por resposta em frequência, de modo que conceitos como 
diagramas de Bode e de Nvquist devem ser apropriadamente generalizados, inclu- 
sive para sistemas MIMO (daqui por diante, para facilitar a notação, poderemos 
omitir, nas funções de transferência, o argumento (s)). É comum, entretanto, que 
além de técnicas robustas que usem L(jw) (os chamados métodos loop-shaping) 
outras funções de transferência sejam usadas, como S e T, que serão definidas a 
seguir. 

Considerando F = 1, tem-se que a saída pode ser relacionada com a entrada 
conforme a Equação (10.1): 


GH 1 GH 
“on tiraa O isan” (10.1) 
— Ed —SS— “SS 


T S T 
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em que S é a chamada função sensibilidade e T é a função sensibilidade com- 
plementar (também conhecida como função de transferência de MF). De fato, 
ambas as funções são de malha fechada (FTMF) e $+ T = 1. Podemos ainda 
escrever que S = 1/(1 + L) e T = L/(1 + L). 

Outra relação importante, semelhante a essa, relaciona o erro teórico E; = 
Y — R (ou seja, o erro não afetado pelo ruido N) com as mesmas entradas, o que 
resulta em: 


E= -SR+ SGD -TN (10.2) 


Normalmente, o que se deseja é que esse erro seja o menor possível em todas 
as faixas de frequência. Como R e D normalmente possuem maior amplitude nas 
baixas frequências, é desejável que S atenue bastante nessa faixa, inclusive para 
compensar altos ganhos que G possa ter. Por outro lado, N costuma ter maior 
amplitude nas altas frequências, o que torna desejável que T atenue nessa outra 
faixa. Felizmente, é o que acontece por conta de S +T = 1. 


Outra importante relação é: 


U=-HS(R-GD-N) (10.3) 


que relaciona o sinal de controle U com os sinais de entrada. O que se nota 
é o papel importante de HS, que é outra FTMF. As três FTMF, ou seja, S, 
T e HS, são importantes para se analisar e projetar o sistema de controle. O 
formato da resposta em frequência para essas três FTMF (tanto SISO, por meio 
do diagrama de Bode de módulo, quanto MIMO, por meio dos valores singulares) 
é usado para especificar o desempenho que o sistema terá. Em particular, um 
importante parâmetro de uma FTMF é a chamada norma H, representada por 
||Slloo, que será definida mais adiante e é de onde vem o nome da teoria aqui 
exposta. 


10.2.1 Robustez 


Quando se utiliza a teoria de controle robusto, supõe-se que o modelo da planta 
possui incertezas de alguma natureza, e que caracterizaremos a planta não como 
uma (matriz de) função de transferência única, mas como uma família contínua 
e bem delimitada dessas funções. As incertezas no modelo normalmente são: 
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1. Incertezas paramétricas: alguns ou todos os parâmetros das funções 
de transferência possuem incertezas na forma de um intervalo de valores 


possíveis. 


2. Dinâmica não modelada: neste caso, as incertezas se apresentam na 
própria estrutura das funções de transferência, como polos e zeros desco- 
nhecidos e até mesmo atrasos de transporte. 


Desse modo, para cada combinação possível de valores das incertezas, tere- 
mos um membro da família de plantas. Podemos ainda incluir as não linearidades 
como incertezas desde que estas possam ser colocadas na forma de não linearida- 
des estáticas delimitadas em um setor, como acontece com o problema da estabi- 
lidade absoluta ou problema de Lurie. A definição matemática precisa será dada 
mais adiante, mas já podemos atualizar o conceito de robustez de estabilidade, 
que é portanto a capacidade do sistema de controle de manter a estabilidade em 
MF para toda a família de plantas, e robustez de desempenho, que é a capacidade 
do sistema de manter o mesmo desempenho para toda a família de plantas. 

A robustez é uma propriedade do sistema em MF, mas quem obviamente con- 
fere esta característica é o controlador por realimentação projetado. Da mesma 
forma que este reduz a influência de D(s) na Equação (10.1) (pois o denominador 
1+GH será maior que 1), ele reduz a influência de um termo de incerteza somado 
à planta, ou seja, G + AG, como é demonstrado em Cruz (1996). 

Por fim, é importante deixar claro que a teoria de controle robusto não precisa 
ser necessariamente utilizada quando se deseja que um sistema de controle tenha 
robustez. De fato, robustez é uma propriedade desejada e obtida em sistemas de 
controle muito antes do desenvolvimento dessa teoria. Sistemas de controle mais 
antigos, projetados com a metodologia clássica, já eram dotados de robustez pelos 
seus projetistas (de fato, dificilmente um sistema que não tenha um mínimo de 
robustez vai funcionar na prática, pois sempre haverá incertezas, não linearidades 


e variações no tempo em uma planta). 


10.3 Sistema nominal 


A família de plantas representa todas as possibilidades de modelos que uma planta 
pode ter durante a sua operação. Ela pode ser uma planta qualquer dentro 
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desta família por um determinado espaço de tempo (inclusive o tempo todo). 
Entretanto, uma das plantas dessa família é especial, pois será utilizada para a 
maior parte dos cálculos de projeto, que é a chamada planta nominal. No caso de 
incertezas paramétricas, esta é a planta obtida usando-se o valor médio de todos 


os parâmetros. 


10.3.1 Estabilidade interna 


Para verificar a estabilidade de um sistema de controle em MF, utiliza-se o cha- 
mado critério de estabilidade de Nyquist, que consiste inicialmente em traçar o 
diagrama polar da função de transferência em malha aberta L(s) = G(s)H(s). 
Se P representa o número de polos de L(s) no semiplano direito, N é o número 
de voltas que o gráfico de Nyquist de L(s) dá em torno do ponto —1 no sentido 
horário, e Z é o número de polos de MF no semiplano direito, então tem-se que 
Z = N+P. No caso de L(s) ser uma matriz de funções de transferência, as 
seguintes modificações devem ser feitas: 1) o percurso de Nyquist se mantém 
igual; 2) deve-se traçar o correspondente grafico polar de Nyquist para a função 
det(J + L(s)); 3) N é o número de voltas em torno da origem. 

O gráfico de Nyquist, entretanto, depende somente dos polos de L(s), isto é, 
dos chamados modos naturais que são controláveis e observáveis. Aqueles que 
são não controláveis e/ou não observáveis simplesmente cancelam com zeros e 
não aparecem em L(s), logo, o gráfico de Nyquist independe deles. Desse modo, 
não está garantida a estabilidade em MF se houver algum cancelamento de polo 
com zero interno a G(s), a H(s) ou entre G(s) e H(s). Diz-se que um sistema em 
MF é internamente estável se, para uma representação em espaço de estados do 
sistema, a origem do espaço de estados é assintoticamente estável o que garante 


a estabilidade mesmo com cancelamento de polos com zeros. 


10.3.2 Desempenho 


A Equação (10.2), que relaciona o erro teórico com o sinal de referência e o 


distúrbio, pode ser modificada para: 


E =-SR4+SD-TN (10.4) 
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em que D é o efeito do distúrbio na saída da planta (não afetado pelo controle). 
Desse modo, a função sensibilidade S relaciona o erro com referência e o erro com 
distúrbio. 

O desempenho desejado para o sistema em MF deve ser traduzido em um 
formato adequado para |S(jw)|. Como foi dito, deseja-se manter |S(jw)| < « 
abaixo de uma certa frequência wa, em que q > 0 é bem pequeno, para se ter 
atenuação de distúrbios, bem como pequeno erro estacionário. Acima de uma 
frequência wp > wa, deseja-se que |S(jw)| — 1 de modo a ter |T(jw)| < eo, 
com €2 > 0 bem pequeno, de modo a atenuar o ruído de medição. A estratégia 
consiste em impor um limite superior para S da forma |S(jw)| < 1//Wp(gw)|, em 
que Wi(jw) é estável e tem uma característica passa-baixas (ao se inverter essa 
função, torna-se um passa-altas). 

É comum se escolher W, como tendo um polo e um zero, com o polo à direita 
do zero (como o compensador por atraso de fase). Quanto maior for |Wa(jw)| 
abaixo de wa, menor será o erro estacionário. Por outro lado, como |S(jw)| 
tipicamente vai ter um pico de ressonância maior que 1 (vide capítulo sobre limi- 
tações de desempenho, sobretudo para sistemas de fase não mínima e instáveis), 
|W,(jw)| não pode ser tão pequeno quanto se queira acima de wp. 

Por fim, para se ter alta fidelidade no seguimento do sinal de referência, é 
desejável que a banda-passante de S (ou seja, a frequência em que o ganho é igual 
a 1/v2, ou —3 dB), seja alta o suficiente. Desse modo, a frequência de corte de 
Wi(Jw) deve ser ligeiramente maior que esse valor. 

Podemos aqui fazer uma introdução informal da chamada norma Hx de um 
sistema. Dado o diagrama de Bode de G(jw), define-se: 


|Glloo = max IG(jw)| (10.5) 


Mais adiante, será explicado por que essa definição faz sentido. Por enquanto, 
podemos colocar a especificação de desempenho na forma ||WS!|le < 1. 


10.4 Família de plantas 


Uma típica família de plantas é apresentada na Figura 10.3a. A curva vermelha 
representa a planta nominal. Em torno de cada ponto dessa curva pode-se traçar 
uma circunferência (marcada em amarelo) que representa a incerteza da planta 
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naquela frequência. Desse modo, para a frequência w temos uma circunferência 
de centro em L(jw) e de raio igual a |W (jw)L(jw)|, em que W(jw) é uma função 
de transferência que representa o erro máximo que pode haver na planta para 
w. Tipicamente, |W (jw)| aumenta com essa variável. Qualquer ponto dentro da 
circunferência pode então ser representado por W(jw)ó(gw)L(jw), em que 6(jw) 
é uma função de transferência com |d(jw)| < 1 conhecida como perturbação. 

O contorno determinado pelas circunferências representa os limites da família 
de plantas. O erro de fase em cada frequência pode ser determinado passando 
duas retas partindo da origem e tangenciando as circunferências. O ângulo entre 
as duas retas representa o erro de fase. Quanto mais próxima a circunferência 
está da origem, maior tende a ser o erro de fase. Se a circunferência contém 
a origem, o erro de fase é de 360º. Por fim, costuma-se supor que W e ô são 
estáveis, o que significa dizer que P é sempre o mesmo para qualquer família de 


plantas (todas as plantas têm o mesmo número de polos no semiplano direito). 


10.4.1 Robustez de estabilidade clássica 


Classicamente, a robustez de um sistema de controle em MF pode ser avaliada 
mais facilmente pelos conceitos de margem de ganho e margem de fase aplicados 
sobre o sistema nominal. Somente para relembrar, margem de ganho é o déficit 
de ganho, em decibéis, na frequência em que a fase da função de transferência 
em malha aberta, isto é, L(s) = G(s)H(s), é igual a 180º. Desse modo, se 
“L(jwiso) = 180º, a margem de ganho é |L(jwso)| (dB). A margem de fase é 
igual à diferença de fase entre ZL(jwr) e 180º na frequência w em que |L(jw)| 
é igual a zero decibéis. Para que o sistema em MF seja estável, ambas devem ser 
positivas. 


(a) (b) 


Figura 10.3: (a) Diagrama de Nyquist da família de plantas e (b) diagrama de Nyquist. 
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Para se ter robustez de estabilidade, alguns autores impõem faixas de valores 
como margem de ganho maior que 5 dB e margem de fase maior que 60º. Pode-se 
argumentar que essas margens são suficientes, na maioria dos casos práticos, para 
garantir que toda a família de plantas respeite a condição de estabilidade (vide 
Figura 10.32). Entretanto, uma definição mais precisa se faz necessária. Um 
bom argumento para abandonar essa definição pode ser visto na Figura 10.3b. 
Apesar de as margens de ganho e de fase serem bastante grandes neste caso, a 
menor distância entre o diagrama de Nyquist e o ponto —1+j0, pode ser bastante 
pequena, como é possível ver. Uma definição mais adequada envolve então essa 
distância. De fato, para impor que esta seja maior que um certo valor M, basta 


escrever. 


min |1 + L(jw)| > M (10.6) 


Utilizando-se da definição da função sensibilidade S, pode-se ver que a con- 


dição de robustez de estabilidade da Equação (10.6) pode ser traduzida em: 


1 
|< 5 (10.7) 


que, como veremos, é a definição de norma Hs da função S. Desse modo, se 


|Slloo = max |S(jw) 


temos uma ideia do “tamanho” da familia de plantas, podemos escolher um valor 
de M adequado para garantir robustez de estabilidade, mesmo não conhecendo 


a família de plantas. 


10.4.2 Robustez de estabilidade quando há familia de plantas 


O modelo do sistema em MF com perturbação ô é apresentado na Figura 10.4a. 
Pode-se escrever a função de transferência p/q = -WL/(1 + L) = 6, de modo 
que o sistema é simplificado para aquele apresentado na Figura 10.4b. Para que 
haja estabilidade em MF para qualquer ó, podemos aplicar o critério de Nyquist, 
em que a função de transferência de malha aberta fica 6(jw)H (jw). 

Supondo que W e 6 são estáveis e que o sistema nominal foi projetado de forma 
que fosse estável em MF (o que é uma exigência óbvia), então o número de polos 
de malha aberta no semiplano direito P para 6H deve ser zero para qualquer 6, 
de modo que para se ter robustez de estabilidade, basta que 1 + (jw) H (jw) #0 
para qualquer ó e w, o que é equivalente a dizer que |1 + H| > 0. Como se 
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tratam de números complexos, a pior situação ocorre quando 1 — |dH| > 0, 
o que significa dizer que |W(jw)T(jw)| < 1 para qualquer frequência, ou seja, 
|T'(jw)| < 1/|W(jw)|, que é a condição de robustez de estabilidade. Essa condição 
também é equivalente a |WT | < 1. 


(b) 


Figura 10.4: (a) Contorno e (b) diagrama de Nyquist. 


10.4.3 Robustez de desempenho quando há família de plantas 


Na especificação de desempenho, podemos pensar que WpS é uma função de 
transferência que relaciona o distúrbio ou referência com um sinal z, conhecido 
como saída de desempenho, que nada mais é que o erro filtrado por Wp, ou seja, 
z = W,Sd, Equação (10.4)). A pior classe de distúrbios que pode haver é aquela 
que causa uma saída y que cresce sem parar. Isso aconteceria se o distúrbio 
estivesse de alguma forma relacionado com o erro filtrado z. Podemos então 
dizer que nesta situação há uma função de transferência 62, com Idol < 1, 
de modo que d = 522, que daria o atraso de fase. De certa forma, isso fecha 
abstratamente uma segunda malha no sistema, e após algum trabalho, teríamos 


a seguinte equação em MF: 


2[1 + L(1 + 85W) + Wyo] = War (10.8) 


De modo a ter estabilidade em MF, podemos aplicar o critério de Nyquist, 
cuja condição necessária e suficiente seria |1 + L(1 + ôW) — Wpô2| > 0. A pior 
situação ocorre quando |6| = |d2| = 1, com 1+ L e Wid2 + WLô com direções 


opostas. Após algum trabalho algébrico, chega-se à equação: 


[Wo(jw)S(jw)] + |W Gu )T(jw)] < 1 (10.9) 
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Desse modo, para que se tenha robustez de desempenho, é necessário e sufi- 
ciente que o sistema nominal tenha o desempenho desejado, e que a robustez de 


estabilidade esteja garantida. 


10.5 Fundamentos matemáticos 


Para se construir uma base mais rigorosa em teoria de sistemas lineares, é preciso 
que conceitos até agora interpretados de forma mais intuitiva sejam colocados em 
uma base matemática. Essa base é a álgebra linear, por meio dos conceitos de 
espaços vetoriais (de dimensão finita e infinita) e análise funcional. Todo sinal que 
entra ou sai de um sistema de controle pode ser pensado como um elemento de 
um espaço vetorial (de dimensão infinita). Para que se possa definir o conceito de 
ganho de um sistema, entretanto, é necessário introduzir uma forma de atribuir 
uma medida a um sinal, o que é feito por meio do conceito de norma. Da mesma 
forma, sistemas podem ser vistos como elementos de um espaço vetorial (também 
de dimensão infinita) e se pode atribuir uma norma (ganho) a estes. Segue-se 


então nas próximas subseções a apresentação desses conceitos formais. 


10.5.1 Matrizes e valores singulares 


Espaço vetorial é o conceito mais básico em álgebra linear, e o leitor certamente 
está familiarizado com o espaço euclidiano n-dimensional R”, ou seja, dos vetores 
com n componentes. Dados dois espaços vetoriais V e U, uma transformação 
linear L : V — U mapeia cada vetor de V em um vetor de U, ou seja, L(v) = u, e 
ainda satisfaz a propriedade de linearidade, isto é, L(avi+bva) = aL(vi)+bL(vo), 
em que v1, V2 E€ V e a,b E R são escalares. Se V e U forem de dimensão finita 
(n e m, respectivamente), podemos achar bases para estes espaços e representar 
os vetores por suas coordenadas nessa base, ou seja, podemos trocar V por R” 
e U por R™. Uma transformação linear L : V > U sempre terá, então, uma 
representação matricial, de maneira que podemos pensar em L como uma matriz 


n x m, que é também elemento do espaço vetorial R"*™. 


e Uma transformação linear L : R? — R? muda o comprimento, a direção e 
o sentido de um vetor tridimensional. Dado um vetor v, se L não muda a 
sua direção, ou seja, se L(v) = Av, dizemos que este é um autovetor de L, 
e à é o correspondente autovalor. 
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e Se e;,e2,e3 formam uma base para R’, podemos montar a matriz E = 
[e] e2 es), ou seja, a matriz quadrada de dimensão três cujas colunas são 
os vetores da base. Desse modo, LE representa a transformação dos três 
vetores da base ao mesmo tempo. Podemos pensar que E forma um parale- 
lepípedo, e uma transformação linear qualquer pode mudar os tamanhos dos 
lados, os ângulos entre os lados, bem como a orientação espacial (mantendo 


sempre a origem, que é um dos vértices, fixa). 


e Dentre as transformações lineares em RË, existe uma classe que mantém 
todos os ângulos entre os lados iguais (ou seja, noventa graus) e o compri- 
mento dos lados iguais. De fato, o elemento i, j da matriz ETE = EET é 
o produto escalar e; - ej, e o cubo de lado unitário corresponderia à matriz 
EET = I, de modo que a transformação que preserva os comprimentos e 
os ângulos deve ser tal que LE(LE)’ = LEETLT = LL" = I. Tem-se 
também que det(L) = +1. 


As matrizes L € R"*" tais que LTL = I são conhecidas como matrizes orto- 
gonais, e aquelas tais que det(L) = 1 são conhecidas como matrizes de rotação, 
que nos casos n = 3 representam rotações físicas do paralelepípedo. É interes- 
sante o leitor pensar no efeito causado sobre o paralelepípedo por transformações 
ortogonais tais que det(L) = —1. 

Considerando G uma matriz qualquer em R”*” e fazendo GE (na base or- 
togonal), se det(G) = 0, então o conjunto de vetores transformados passa a ser 
linearmente dependente e não mais forma uma base. Se det(G) £ 0, os compri- 
mentos e os ângulos mudam, mas continua sendo uma base. Para G € R”””, 
as matrizes G'G e GGT são simétricas. Neste caso, para autovalores distintos, 
tem-se que os autovetores são ortogonais. Se todos os autovalores forem positi- 
vos, diz-se que é uma matriz definida positiva. Se um ou mais forem nulos, então 
é uma matriz semidefinida positiva. Se V = [v1,... Vn] é a matriz formada por 
uma base de autovetores, tem-se que G'GV = AV, em que A = diag(A.::- , An) 
é a matriz diagonal dos autovalores. Multiplicando à esquerda por VT, tem-se 
que VTGTGV = V7AV = VTGTGV = V'VA. Como essas duas últimas ma- 
trizes são diagonais, temos que GV é ortogonal, porém os tamanhos dos vetores 
podem não ser unitários. Se U = [u,,:--u,) for a matriz dos vetores ortogonais 
e de módulo 1 da base do espaço de chegada, então GV = UX, em que © = diag 
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(01.::: ,0n). Desse modo, pode-se escrever a chamada decomposição em valores 
singulares: 

G=ULVT (10.10) 
em que E = diag (01,::: ,0n). Neste caso real, pode-se fazer uma transformação 


de coordenadas de forma que o elemento na diagonal principal da esquerda seja 
sempre maior que os seus vizinhos da direita, ou seja: o1 > --- > on. Pode-se 
dizer que a base de entrada, com cada vetor sendo unitário, é transformada numa 
base também ortogonal em outro espaço. Como existe uma correspondência entre 
os vetores v; +> u;, pode-se dizer que o; é o ganho na direção i. O maior valor 
singular é sempre o primeiro, ou seja, @ = g1, e o menor é sempre o último, ou 
seja, g = On 

No caso de interesse para controle robusto, a matriz G será complexa e função 
da frequência w, ou seja, G(jw) € C™*". Entretanto, em vez de base ortogonal, 
as bases deverão ser unitárias, ou seja, VV! = UU! = J, em que (-)! representa 
o conjugado hermitiano, que é o conjugado (complexo) da matriz transposta. 
Os valores singulares continuam sendo números reais positivos. Desse modo, a 


decomposição em valores singulares fica: 


G=Uzvt (10.11) 


Para o caso de G não ser mais quadrada, a formula continua válida, porém 
as bases de entrada e saída serão diferentes, e © não será mais quadrada. 


10.5.2 Espaços de Banach 


Dado um espaço vetorial V (de dimensão finita ou não), uma norma é uma função 
ll- I| : V > [0, 00) que, a cada vetor v € V, associa um número real positivo e tal 


que: 
e ||v|| = 0, em que a igualdade só ocorre se v = 0; 
e |lav|| = |alllvil, em que a € R; 


e ljvi + val! < Ilvill + Ijvoll para qualquer par vi,v2 € V (desigualdade 
triangular). 
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Um espaço vetorial munido de uma norma é conhecido como espaço vetorial 


normado. Exemplos de espaços vetoriais normados, de dimensão finita, são: 


e o espaço euclidiano R” com a norma definida por: ||v||2 = vv”'v, conhecido 


como norma 2, ou norma euclidiana; 


e o espaço euclidiano R” com a norma ||v||p = 4w|P+ [ug]? +--+ + [Vn]? 
para qualquer p inteiro positivo, ou ainda ||v||,, = maxi<i<n |vil, que é 
equivalente ao caso para p — 00; 


e sendo C” igual ao produto cartesiano de n cópias do conjunto dos números 
complexos (ou seja, o espaço vetorial dos vetores complexos), podemos de- 
un|? = Vutu, em que |u;| = /ujt é o 


módulo do número complexo e ul é o conjugado hermitiano; 


finir |lul|2 = Jun [É + |u|’ +--+ + 


e de forma similar, pode-se definir |/ul|, para vetores complexos. 


É sempre possível definir a distância d entre dois vetores em um espaço vetorial 
normado a partir da norma, da seguinte forma: 


d(vi, v2) = ||vi — vo! (10.12) 


de maneira que todo espaço vetorial normado é um espaço métrico. 

Dado um espaço vetorial normado (V, ||- ||) e uma sequência {vn} de vetores 
nesse espaço, diz-se que esta é convergente (e converge para o limite v € V) 
se limpe |Vn — v|| = 0. Diz-se que uma sequência {vn} é de Cauchy se 
limn.m—oo ||Vn — Vml| = 0. Uma sequência de Cauchy nem sempre é conver- 
gente, apesar de a distância entre os elementos sempre diminuir. É comum, em 
espaços de dimensão infinita, que uma sequência de Cauchy convirja para algo 
que não pertence ao espaço vetorial. Por isso, diz-se que um espaço vetorial nor- 
mado é completo se toda sequência de Cauchy for convergente. A todo espaço 
vetorial normado completo se dá também o nome de espaço de Banach. Todo 
espaço vetorial normado de dimensão finita é de Banach. 

Os espaços vetoriais de dimensão infinita, por outro lado, são mais complexos. 
Ao contrário dos espaços de dimensão finita, nem todo espaço vetorial de dimen- 
são infinita possui uma base contável a partir da qual qualquer elemento pode ser 
obtido por um combinação linear. Os espaços V que possuem essa propriedade 


194 Sistemas dinâmicos e mecatrénicos, vol. 1 


são chamados de separáveis, isto é, possuem um subconjunto B contável e denso 
em V, de modo que qualquer elemento de V está infinitesimalmente próximo de 
algum elemento de B. 


O espaço vetorial das funções continuas e limitadas em um intervalo limitado 
e fechado [a,b] com a norma ||f|| = sup;e(ab) |f(t)|, isto é, Cla, b], é um espaço 
separável. De fato, qualquer função contínua em um intervalo fechado pode ser 
uniformemente aproximada por um polinômio de coeficientes racionais (este é o 
teorema da aproximação de Weierstrass). Entretanto, costuma-se trabalhar em 
controle robusto com outras classes de funções que, mesmo não sendo contínuas, 


representam mais adequadamente os sinais. 


Se T € R é algum subintervalo fechado dos reais, define-se o espaço vetorial 
Lp(T) das funções complexas cujo domínio é T e tal que: 


flo = y f Lf (pat < œ (10.13) 


Esse espaço vetorial é normado com norma igual a || f ||». No caso em que p = 00, 


esta definição é modificada para: 


|flloo = ess suprer| f(t)| (10.14) 


em que ess sup é o supremo essencial, que é o supremo da função com exceção 
de um conjunto de medida nula (este conceito será mais bem explicado mais 


adiante). Podemos dizer então que esse último espaço é o das funções limitadas. 


Há ainda as funções /sinais com valores vetoriais, isto é, f : T CR — C”, de 
modo que este pode ser pensado como um vetor de n funções. Neste caso, tem-se 


que a norma se define por: 


itll = / f e@ipar (10.15) 


para 1 < p < oo, em que a norma dentro do integrando é a norma de C". No 
caso em que p = œ, essa definição é modificada para: 


flo = ess suprer|f(B)Ilso (10.16) 
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A representação desses espaços é da forma Lp (T), em que n indica a dimensão 
do vetor. 

As funções /sinais nesses espaços não são contínuas em geral, mas muitos sinais 
práticos apresentam essa propriedade. Os espaços Lp(T) são espaços de Banach 


e, para p < oc, eles também são separáveis. 


10.5.3 Espaços de Hilbert 


Dado um espaço vetorial V, um produto interno é uma aplicação (-,-) : V xV — C 


tal que: 
e (v,v) > 0; 
e (v,v) = 0 se e somente se v = 0; 
e (u, @1Vı + Gava) = a1 (u, v1) + a2(u, v2); 
e (v,u) = (u,v). 


Os espaços vetoriais munidos com um produto interno são chamados de es- 
paços com produto interno, e generalizam o conceito de produto escalar. Sempre 
podemos definir uma norma em um espaço desse tipo, que é: |jvil = y{v, v}. 
Diz-se que dois vetores v,u € V são ortogonais se (v,u) = 0. Neste caso, vale 
llv + ull? = liv? + [lull?. 

Dado um espaço vetorial V com um produto interno (-,-), se esse espaço for 
ainda um espaço de Banach (com a norma definida a partir do produto interno), 
diz-se que ele é um espaço de Hilbert. 

Alguns exemplos de espaços de Hilbert são: 


e o espaço vetorial de dimensão finita C” com produto interno dado por: 


(vu) = yu + Doug +--+ + Un = viu; 


e o espaço vetorial de dimensão nm das matrizes complexas C"*™ com pro- 
duto interno dado por (A , B} = tr(AtB), em que A, B € CM etr(:--)é 
o traço de uma matriz, que consiste na somatória dos elementos da diagonal 


principal; 


e o espaço vetorial de dimensão infinita La(—>0, +00) com o produto interno 


dado por (f,9) = Vl f(t)g(t)dt, que é também separável. 
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10.5.4 Espaços de sistemas: normas de sistemas 


Podemos encarar uma matriz complexa como um sistema que transforma vetores 
de entrada em vetores de saída, mudando direção, módulo e fase. Há várias 
formas de definir normas de matrizes, entretanto, as que têm interesse aqui são 


as chamadas normas induzidas, pois são normas de sistemas por excelência. 


Dada a norma de vetores (de entrada e saída) || - ||, como definida anterior- 


mente, tem-se que a norma induzida da matriz G é: 


|G||p = max IGullp = max ||Gull, (10.17) 
u#0 |lullp ——ullp=I 


ou seja, trata-se do ganho maximo que a matriz pode dar, o que ocorre para um 
específico vetor de entrada não nulo, que precisa ser determinado pela otimização. 
Essa definição também vale para matrizes complexas, com os devidos ajustes. 

Para o caso específico de p = 2, tem-se que ||G|lo = a(G), ou seja, a norma 
é igual ao valor singular máximo da matriz. Como o espaço das matrizes pos- 
sui multiplicação, este é na verdade uma álgebra associativa (mais especifica- 
mente, uma álgebra de Banach). Os seguintes resultados são válidos: ||GH ||p < 
IGlp|| lp € ||Gullp < IIGllpllullp- 

Se considerarmos que um sistema LIT MIMO é um bloco que transforma um 
sinal de entrada u : T > R” em um sinal de saída y : T > R” (em que T é algum 
intervalo de R), devemos representar esse sistema como uma transformação linear 
entre dois espaços vetoriais, ou seja, L : Lp (T) > LP(T). Sabemos, da álgebra 
linear, que transformações lineares entre espaços de dimensão finita são repre- 
sentadas por matrizes, e que as matrizes de um determinado tamanho também 
pertencem a espaços vetoriais. Como os espaços vetoriais de sinais Ly (T) têm 
dimensão infinita, é razoável supor que os sistemas LIT (que são transformações 
lineares) também pertençam a espaços vetoriais de dimensão infinita. 

De fato, sabemos que a relação entre a entrada e a saída em um sistema LIT 


é dada pela convolução: 


y(t) = k G(t — T)u(r)dtr =Gx*u (10.18) 


de modo que podemos pensar que a convolução de G(t) (resposta ao impulso do 
sistema, que é uma função com valores matriciais) com o sinal de entrada u(t) 
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corresponde a uma transformação linear L. Como G(t) também é um sinal, o 
espaço dos sistemas LIT é também de dimensão infinita. 
Para definir as duas normas mais importantes para controle robusto, precisa- 


mos falar dos espaços: 


. or (jR): espaço de Hilbert das matrizes de funções de transferência n x m, 


que têm produto interno: 
1 oo 
(RG) = — J tr(FŻ?(jw)Gljw))dtw (10.19) 
or J- 


e cuja norma é então: 


Fla = Th f j tr (Fi (jw) F (jw) )dtew (10.20) 


Para que esta norma seja finita, é necessário que as funções de transferência 


sejam estritamente próprias. 


e Lu" (FIR): espaço de Banach das matrizes de funções de transferência G(jw) 


com norma: 


Flo = ess supyero(F(jw)) (10.21) 


Para que esta norma seja finita, é necessário que as funções de transferência 


sejam próprias (não precisam ser estritamente próprias). 


Entretanto, os sistemas nos quais que estamos interessados fazem parte de 
subespaços. Mais especificamente, estamos interessados nos chamados espaços de 
Hardy H2 C L3™ (jR), que é o espaço das matrizes de funções de transferência 
estáveis, racionais e estritamente próprias, e Hx C LX"(jR), que é o espaço 
das matrizes de funções de transferência estáveis, racionais e próprias. Ambos os 
espaços herdam a norma dos espaços em que estão contidos. 


Pode-se mostrar que para a norma Hə do sistema F(s), vale: 


|F(gw)llo = sup Ilya (10.22) 
0<|full2<oo llull2 
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ou seja, esta norma representa o ganho máximo de energia do sinal (que ocorre 


para alguma direção). 


10.5.5 Planta estendida 


De maneira geral, podemos manipular o diagrama de blocos do sistema em MF 
e colocá-lo na forma apresentada na Figura 10.5, em que A(s) é a matriz de 
funções de transferência do controlador, A(s) é a matriz das perturbações, que é 


sempre bloco-diagonal e tem [All < 1, e P(s) é a chamada planta estendida. 


u V 


Figura 10.5: Diagrama de blocos para controle robusto. 


A planta estendida deve conter, além das funções de transferência da planta, 
as diversas funções peso descritas anteriormente. O vetor de sinais w contém 
todos os sinais de origem externa, como referências e distúrbios. O vetor de 
sinais z contém as chamadas saídas de desempenho, como o erro filtrado descrito 
anteriormente. 

O projeto conhecido como ótimo Hə consiste em determinar as funções peso 
de desempenho, de incerteza na planta e de penalização do controle, e incluí- 
las na planta estendida P(s). Nesta fase, considera-se A(s) = 0 (isso não quer 
dizer que estamos fazendo o projeto para a planta nominal, pois o peso W das 
incertezas está incluído em P), de modo que a matriz de funções de transferência 
em malha fechada que relaciona w e z é dada pela fórmula: 


z = [Pu + PoK(I + Po K) Pa] w (10.23) 
a eee 
Fi(P,K) 
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em que F; é conhecida como transformação linear fracionária inferior das ma- 
trizes P e K. Em seguida, busca-se encontrar o controlador K(s) que estabiliza 
internamente o sistema em malha fechada com a planta estendida P(s) e tal que 


satisfaça o problema de otimização: 


“min Fil P, K)|loo (10.24) 
K(s) inter. estab. 


Se for encontrada a solução para este problema de otimização, teremos um 
controlador internamente estabilizante tal que o máximo ganho de energia entre 
os sinais de entrada (disturbios e referências) e o erro filtrado é minimizado. As 
especificações estão incluídas em W, e as incertezas na planta em W, de modo 
que se espera robustez. 

Por fim, é necessário checar se realmente o sistema projetado possui robustez 
de estabilidade e de desempenho. Isso é feito por meio da chamada análise u, que 
usa o conceito de valor singular estruturado, que vale para sistemas MIMO em ge- 
ral. Por falta de espaço, não apresentaremos tal ferramenta, mas recomendamos 
as referências. Da mesma forma, a técnica de redução de ordem de controlado- 
res será omitida, entretanto, pode ser muito importante quando o controlador 


resultante deste projeto for de ordem muito alta. 


10.5.6 Problema de sensibilidade mista 


O problema de otimização na Equação (10.24) é em geral impossível de se resol- 
ver. O que se faz, entretanto, é buscar um controlador subótimo. Para ilustrar 
o processo, vamos considerar um caso SISO, de modo que a especificação de de- 
WT]lo <1 
e, ainda, |W K S||œ < 1 limita a amplitude que o sinal de controle pode assumir 


sempenho é ||W,5||.. < 1, a condição de robustez de estabilidade é 


pela escolha de uma penalização W,,(jw) (quando |W,,(jw)| é grande, a amplitude 
de controle é pequena naquela frequência), Equação (10.3). 


Pode-se mostrar que no caso da matriz de funções de transferência: 


WS 
F(P,K)=| WT (10.25) 
WKS 


tem-se que 
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| FU(P, K)loo = max VIW,SP + IWTP + |W KS}? (10.26) 


de modo que se garantirmos que [F(P,K)ll» < 1, teremos as especificações 
satisfeitas, bem como robustez de estabilidade e desempenho, além de limitar o 
sinal de controle. 

Embora saibamos que o problema de otimização na Equação (10.24) não será 
resolvido, busca-se achar um controlador tal que [F(P,K)lx < y, e quanto 
mais próximo y for do valor 1, melhor. Nesta situação, tem-se que |S(jw)| < 
YAWio(w))l, |T(Gw)| < y/|W(w))| e, ainda, |KS(Gw)| < y/|Wu(w))]. Há algorit- 
mos comerciais que buscam o subótimo de forma iterativa, com algum critério 
de parada. Eventualmente, após várias iterações, y pode ficar próximo de 1, ou 
até menor (quem sabe até chegue próximo do ótimo), o que também satisfaz as 
especificações. Se o melhor valor de y a que se chegar for muito acima de 1, 
há algum problema com as especificações (não podem ser atendidas) ou com a 
planta em si (não controlável /observável, por exemplo). 

O algoritmo de Doyle busca encontrar um controlador na forma de realimen- 
tação de estados com observador, por meio da solução de duas equações algébricas 
de Riccati (ARE). Entretanto, há também a abordagem por desigualdades ma- 
triciais lineares (ou LMI), que é bastante popular. 


10.6 Aplicações de polynomial chaos a controle ro- 


busto 


Polynomial chaos consiste de uma ferramenta matemática bastante utilizada para 
análise de sistemas incertos (quantificação de incertezas). As aplicações mais co- 
muns envolvem sistemas mecânicos com incertezas nos parâmetros. As aplicações 
em sistemas de controle ainda estão em seu início, e o objetivo desta seção é apre- 
sentar de uma forma introdutória os conceitos principais envolvidos nessa teoria 
e sua aplicação em controle robusto. 

Polynomial chaos envolve a expansão de variáveis aleatórias (portanto, teoria 
da probabilidade) em espaços de Hilbert de dimensão infinita, podendo estas ser 
parâmetros, entradas ou saídas de um sistema dinâmico. Entretanto, esses espa- 
ços são um pouco mais complexos que aqueles apresentados até agora. De fato, 
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é necessário inicialmente definir espaços mensuráveis, medidas de probabilidade e 


integral de Lebesgue. 


10.6.1 Ferramentas matemáticas básicas 


O conceito de integral é fundamental para o estudo de probabilidades. A integral 
normalmente estudada em cursos básicos de engenharia e ciências é a chamada 
integral de Riemann, que possui certas limitações. Para o estudo proposto aqui, 
a definição precisa ser modificada para se tornar mais geral, por meio da integral 
de Lebesgue. Antes, porém, de apresentar essa definição, convém definir a integral 
de Riemann-Stieltjes como uma integral de uma função f com respeito a outra 


função g, que é representada da forma: 


j= f ” §()dtg(x) (10.27) 


O valor s representado na Equação (10.27) é o resultado do seguinte processo 
limite: dada uma partição do intervalo a = xo < £1 < +- Ti < Zip, < o an = b, 
em que 5 > 0 é o comprimento da maior partição, e ainda, para todo i, tem-se 
que 2; < ti < 241, para cada e > 0 existe um 6 > O tal que: 


N-1 


> Ht)lg(xia) — glz:)] — s 


1=0 


<E (10.28) 


Diz-se que a função f é um integrando, e a função g é um integrador. Se 
a função integradora g for continuamente diferenciável, isto é, for de classe C!, 
então: 


b b 
| Hodisa) = f s(a)o'(w)atx (10.29) 


ou seja, a integral de Riemann-Stieltjes se reduz a uma integral de Riemann 
simples. 
Dado um conjunto U, define-se uma o-álgebra F como uma família de sub- 


conjuntos de U tais que: 
1. se A E€ F, então A/U € F (complemento de A em U); 
2. se A,B € F, então AUB E F. 


pode-se mostrar que qualquer união ou intersecção finita de subconjuntos per- 
tencentes a F também pertence a esta família. Diz-se que uma dupla (U, F) é 
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um espaço mensurável. Dados dois espaços mensuráveis (U,F) e (V,G), diz-se 
que uma função f : U —> V é mensurável se, para cada A € G, a imagem inversa 
f(A) pertence a F. 

A um espaço mensurável podem-se atribuir medidas, que são funções de con- 
junto da forma u : F — R. Uma medida positiva é uma função de conjunto 
uu: F — R+ tal que, para qualquer A € F, tem-se: 


1. (A) > 0; 


2. w(AU B) = u(A) + p(B) se (AN B) = Ø (medida da união de conjuntos 
disjuntos é aditiva). 


Pode-se mostrar que o conjunto vazio tem medida nula. Existem, porém, ou- 
tros subconjuntos com medida nula, mas que não são vazios (são apropriadamente 
chamados de conjuntos de medida nula). 

Um espaço mensurável (U, F) com uma medida y é representado por (U, F, p) 
e chamado de espaço de medida. Dado o espaço E, a medida que atribui ao 
intervalo (a,b) o número b — a é conhecida como medida de Lebesque. Essa 
medida pode ser estendida para R” como (bı — aı)(b2 — a2)--+ (bn — an), e o 
espaço mensurável correspondente é conhecido como espaço de Borel, (R”, B) 
(que inclui o caso para n = 1). 

Dado um espaço de medida (U, F, p), uma função real positiva f:U — R* 
et € R*,o conjunto S;(t) = f (f(x) >t) CU contém todos os pontos de U 
tal que f(x) >t. Podemos ainda definir a função real positiva monotonicamente 


não crescente F(t) = u(Sy(t)), de modo que a integral de Riemann: 


/ f(z)dtu(z) = f ” P(t)dt (10.30) 
U 0 


é conhecida como integral de Lebesque da função f. 

A diferença entre a integral de Riemann, que se aprende normalmente em 
cursos de cálculo, e a integral de Lebesgue de f está no fato de a primeira envolver 
o limite da soma de retângulos verticais de área f(t;)(x;y1 — Ti) e a segunda ser 
a soma de retângulos horizontais empilhados de forma que preencham a área 
abaixo do gráfico. A integral de Lebesgue está também definida para uma classe 
mais ampla de funções que a de Riemann, além de possuir propriedades mais 
interessantes. 
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Alguns espaços de Banach definidos em espaços mensuráveis são de impor- 
tância fundamental (FERNANDEZ, 2002): dado um espaço de medida (U, F, p) 
e um número 1 < p < o real, define-se L (U, F, p) como o espaço vetorial das 


funções mensuráveis tais que: 
/ |f|Pdtu < 00 (10.31) 


Se identificarmos todas as funções mensuráveis que forem iguais a.e. (isto 
é, iguais exceto em um conjunto de medida nula, de modo que têm a mesma 
integral), tem-se o espaço vetorial Lp(U, F, p) das classes de equivalência [f] de 
funções que são iguais a.e, munido com a norma: 


Ifllp = ( / isan) (10.32) 


em que f é um representante da classe de equivalência [f], que é um espaço de 
Banach. Em particular, para p = 2, tem-se que Lo(U, F, p) é também um espaço 
de Hilbert. Neste caso, o produto interno é dado simplesmente por: 


(f.9) = f fadty (10.33) 


e a norma fica igual à definida anteriormente quando for induzida por este produto 
interno. 


10.7 Probabilidades e variáveis aleatórias 


O conjunto dos resultados de um experimento é representado por Q (que é um 
conjunto genérico) e qualquer resultado em particular é representado por um ele- 
mento desse conjunto, ou seja, w € Q. Os eventos são subconjuntos mensuráveis 
de Q, e a probabilidade atribuída a um evento deve ser tratada como uma medida, 
e não uma função. 

Um espaço de probabilidade é um espaço de medida (N, F, P) em que P : 
F > [0, +00) é uma medida de probabilidade, ou seja, é sempre positiva e tal que 
P(Q) = 1, e F é a o-álgebra dos eventos aos quais se atribui uma probabilidade. 
Uma variável aleatória é uma função mensurável A : (Q, F, P) > (R,B) que a 
cada resultado do experimento associa uma quantidade numérica A(w). 
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O exemplo mais simples de variável aleatória é a função característica de um 
evento, ou seja, xa : F — [0,1], que vale 1 em A e zero no restante de Q. A 
seguinte identidade, envolvendo integral de Lebesgue, é válida: 


É xalw)dtP(w) = P(A) (10.34) 


O valor esperado de g(A), com g : R — R sendo uma função real qualquer, é 
definido como: 


E(g(A)) = f, g(A(w))dtP(w) (10.35) 


e o espaço Lı (Q, F, P) é o das variáveis aleatórias com valor esperado finito. Duas 
variáveis aleatórias A;, A são iguais se Aj(w) = As(w) para todo w €E Q, e são 
iguais com probabilidade 1 (equivalente a a.e.) se Ai(w) = Ao(w) para todo w 
pertencente a um conjunto A tal que P(A) = 1. 

Dado (Q, F,P) e A uma variável aleatória, cada intervalo A € R possui 
uma probabilidade induzida dada por P(A~!(A)). Em particular, os abertos 
(—oo, x) possuem probabilidade induzida dada por P(A~!(—oo, £)), o que define 
a função F(x) = P(A~!(—oo, x)), conhecida como distribuição de probabilidades. 
Uma função distribuição de probabilidade F(x) possui as seguintes propriedades: 
lim-o F(x) = 0, limpsoo F(x) = 1e 0 < F(x) < 1 para qualquer x € Re é 
sempre não decrescente (não necessita ser continua). 

Dada uma função qualquer g : R —> R de A, pode-se calcular o valor esperado 
pela integral: fa 

Blg(A)] = | AJP) = [  alajdtr(a) (10.36) 


e a variância de A por: 
(A) = E[(A — E[A])?] = E[A?] — E(AJ? (10.37) 


No caso da distribuição de probabilidade associada F(a) ser diferenciável, 
então existe a função densidade de probabilidade f(x) tal que: 


EWA) = fox) f(e)eat (10.38) 


Diz-se que dois eventos A, B € F são independentes se P(AN B) = P(A)P(B) 
sendo que essa definição se estende de forma óbvia para uma familia de eventos 
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Ar, ..., An. Duas o-álgebras F,G são independentes se quaisquer pares de eventos 
Ai, Bj com A; € F e Bj € G forem independentes. Dada uma variável aleatória 
A, uma o-álgebra induzida por A, que é representada por o(Ã), é formada pelas 
imagens inversas dos abertos de (R, B), ou seja: 


(A) = (A HA)VA c B(R)} (10.39) 


A ocorrência de um evento A € F traz informação sobre o resultado de um 
experimento. Desse modo, o(A) retrata a informação que pode ser obtida sobre 
o experimento fornecida pela variável aleatória A. Se duas variáveis aleatórias 
A1, Ag são relacionadas por Az = g(A1), vale então que o(A;) C o(Ão). Isso 
significa que a informação fornecida por Ay também é fornecida por A;. Duas 
variáveis aleatórias A,, Ay são independentes se as respectivas o-álgebras, isto é, 
o(A1),0(As), são independentes. Assim, a ocorrência de eventos independentes, 
ou equivalentemente a leitura de duas variáveis aleatórias independentes, sempre 
aumenta a informação. Dado um espaço de probabilidades (Q, F,P) e duas 
variáveis aleatórias independentes A1, Ag E€ Lı (Q, F, P), tem-se que: 


E(A142) = E(A1)(A2) (10.40) 


O espaço de Hilbert Lo(Q,F, P) é o espaço das variáveis aleatórias com vari- 
ância finita, conhecidas também como variáveis aleatórias de segunda ordem. O 


produto interno é: 


E(Ado) = ji Ai (w)Ao(w)dtP(w) (10.41) 


Em alguns experimentos, pode haver diversas variáveis aleatórias. É possí- 
vel ter relacionamentos entre um conjunto de variáveis aleatórias A,,--- , An de 
independência até dependência total. Um vetor de variáveis aleatórias é uma apli- 
cação À : (Q, F, P) — (IR",B) formada pelas variáveis aleatórias componentes 
Aj, Ao,--- ,A,. Para cada aberto A € (R”, B), pode-se induzir uma probabili- 
dade, resultando em uma distribuição de probabilidade conjunta F(x1,+-+ , En) = 
P((-00,21) x +++ x (—00,2,)) tal que, se essas variáveis forem independentes, 
F(xi,xo, sn) = F(a) F l) Fiaa) É possível então se calcular os cha- 
mados momentos, utilizados em várias fórmulas importantes. 
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Por exemplo, para duas variáveis aleatórias, tem-se que: 


F(A; Ao) = p f. x r2dtF (x1, £2) = f. T T122 f (£1, r2)dtr,dtr2 
verre a ae ae (10.42) 
sendo que a igualdade do lado direito só vale se houver função densidade de pro- 
babilidade conjunta f(a ,22). No caso de independência, tem-se que F(A; A2) = 
E(Aı)E(â2). A covariância das duas variáveis (independentes ou não) é dada 
por cov(A;, A2) = E{ (A; — E(A;))(A2 — E(Ag))} = B(A; Ag) — E(A1)E(A2). 
Se as variáveis aleatórias A;, Ag forem independentes, então cov(A;, Ag) = 0. 


10.7.1 Processos estocásticos 


Os sistemas dinâmicos estudados em teoria de controle, como já foi dito, possuem 
vários sinais de entrada e de saída. Quando os sinais de entrada ou um ou mais 
parâmetros do sistema são aleatórios, a ferramenta que se utiliza para o estudo é 
o processo estocástico. 

Dado um espaço de probabilidade (Q, F, P), um processo estocástico {X+,t € 
T} é uma coleção de variáveis aleatórias sobre o mesmo espaço de probabilidade 
(Q, F, P), em que T é um conjunto de índices que normalmente representa o 
tempo (contável ou incontável). Desse modo, um processo estocástico pode ser 
escrito como uma aplicação X : T x 2 — R, ou seja, X(t,w) é o valor da 
variável aleatória no instante t. Se o resultado do experimento for w, tem-se 
uma particular realização de X, que é uma função do tempo X,,(t). Essa função, 
a princípio, pode ser qualquer função mensurável em relação a T. Para um 
determinado t € T fixo, tem-se a variável aleatória X;(w). Evidentemente, a 
relação existente entre as diferentes variáveis aleatórias do processo (por exemplo, 
X;, € X;,) pode ser bastante variada, indo de dependência total a independência. 

Dois processos estocásticos X,, Y, são iguais se X;(w) = Y;(w) para todo t € T 
ew € 9. Diz-se que eles são versões um do outro se Xi(w) = Y;(w) para todo 
w pertencente a um conjunto A tal que P(A) = 1 e para todo t € T. A forma 
de se especificar um processo estocástico completamente seria conhecer, para 
cada n-dupla de variáveis aleatórias (X; (w), Xņ (w), +++, Xt„(w)), para todo valor 
de n, a distribuição de probabilidade conjunta F (Lt ,Ttz;*** +t). Entretanto, 
processos estocásticos que são versões um do outro possuem a mesma família de 
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distribuições conjuntas, de modo que cada família determina uma infinidade de 


processos estocásticos. 


A caracterização de um processo estocástico com relação às realizações ao 
longo do tempo é fundamental em aplicações. É necessário saber se as trajetórias 
são contínuas, absolutamente contínuas, diferenciáveis etc. Há processos, como o 
de Wiener (que será visto mais adiante), que podem ter versões contínuas (porém 
sem ser diferenciável em nenhum ponto). De fato, se existem constantes positivas 
a, 3, D tais que: 

E(|X; — Xl”) < Dit — 5/04 (10.43) 


então existe uma versão de X com trajetórias contínuas (este é o teorema da 


continuidade de Kolmogorov). 


Um dos processos estocásticos mais amplamente usados no estudo de sistemas 
dinâmicos é o processo de Wiener W+, ou caminho aleatório, de modo que a sua 
derivada (num sentido generalizado) é o ruído branco. As seguintes propriedades 
são satisfeitas por W;: a) Wo = 0; b) os incrementos W; — Ws são variáveis 
aleatórias gaussianas com média zero e variância t — s; c) as variáveis aleatórias 


Wi — Ws e Ws — Wry, em quer < ses < t, são independentes. 


A densidade de probabilidade de primeira ordem de W; é dada por: 


fw (t, w, m) = e = (10.44) 


em que w representa a posição de uma partícula com ponto de partida m e 
passadas t unidades de tempo, de modo que uma realização de W, representa 
a trajetória de uma partícula (movimento browniano). A variância para essa 
distribuição é t. Nao é possível, entretanto, provar que W; é diferenciável em 
algum ponto, de modo que a sua derivada não está definida. 


Um processo estocástico pode ser expandido em uma série chamada de Karhunen- 
Loeve, que consiste em expandir um processo estocástico de tempo contínuo em 
uma base de funções ortogonais determinísticas. O espaço apropriado é L*({a, b]) 

e a expansão tem propriedades semelhantes às da série de Fourier, no sentido de 
que minimiza certo critério de custo. Entretanto, os coeficientes da expansão são 
agora variáveis aleatórias, de modo que ao se truncar tal série, pode-se aproximar 
um processo estocástico de tempo contínuo, que possui um número incontável 
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de variáveis aleatórias, por um conjunto finito de variáveis, o que é adequado do 


ponto de vista numérico. 


Dado um processo estocástico de valor esperado nulo X+, em que t € [a,b], 
e o espaço de Hilbert L?( [a,b]), o processo em questão pode ser decomposto na 
forma: = 
X => andx(t) (10.45) 
k=1 
em que {@,(t)} é uma base ortogonal de L?([a,b]), e o conjunto infinito {ax} são 
variáveis aleatórias descorrelacionadas duas a duas, ou seja, E(a;a;) = dij. Diz-se 
também que se trata de uma expansão biortogonal, pelo fato de E(a;a;) também 
ser um produto interno. A fórmula para o cálculo dos coeficientes da expansão 


(ou seja, das variáveis aleatórias) é análoga à da série de Fourier, ou seja: 


ano) = f Xle wolde = (Xalil) (10.46) 


Para encontrar a base de funções ortogonais, é necessário resolver a equação 
de Fredholm: 


f R(tı,t2)ġ(t2)dtt2 = uó(ti) (10.47) 


em que o núcleo R é a função de autocorrelação do processo X;, de modo a 
encontrar as funções ortogonais (autofunções). Normalmente, tem-se a função de 


autocorrelação e é necessário resolver a equação integral. 


O processo de Wiener pode ser representado por: 


mn 


Wi = dot + V2 Ý dn (==) (10.48) 
n=1 


em que {dn} é uma sequência de variáveis independentes e independentemente 
distribuídas gaussianas do tipo N(0,1). 


As expansões de Karhunen-Loeve são também consideradas ótimas, uma vez 
que minimizam o número de variáveis aleatórias necessárias para representar o 
caráter aleatório do processo. 
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10.7.2 Sistemas diferenciais estocásticos 


Conforme foi mencionado, interessa estudar neste trabalho os sistemas de equa- 
ções diferenciais que, dado um espaço de probabilidades (2, F, P), são da forma: 


x = F(x,t,w), com x(0) = xo (10.49) 


em que x é um processo estocástico com n componentes (n coordenadas, cada 
uma sendo um processo estocástico com valores reais), t € R, xo é um vetor de 
n variáveis aleatórias no espaço mensurável, t é o tempo e w € Q. A solução 
desse sistema é um processo estocástico X(t,w) tal que X(0,w) = xo(w). Alguns 
parâmetros desse sistema podem ser variáveis aleatórias no mesmo espaço de 


probabilidades (Q, F, P), enquanto outros podem ser processos estocásticos. 


Estamos interessados em sistemas da forma: 


Xw) = A(X, t,w) + BCX), t,w)U,(w) (10.50) 


em que U; é um processo de entrada e as funções A e B podem depender de 
outras variáveis aleatórias além de X;(w). Se U;(w) for um processo estocástico 
no sentido estrito, ou seja, U(t,w) : T x Q — R™, então a solução do sistema 
na Equação (10.50) pode ser encontrada resolvendo-se por métodos tradicionais 
para cada w fixo. Para que haja solução e esta seja única, normalmente se exigem 
condições do tipo Lipschitz sobre as funções A e B e que o processo estocástico 
U(t.w) seja limitado e suas trajetórias sejam funções mensuráveis no tempo. Em 
alguns casos, entretanto, U, é o ruido branco, de modo que é mais conveniente 


se trabalhar com uma versão generalizada da equação, que é a forma integral: 


Xe(w) — Xo(w) = I A(Xs,s,w)dts + jä B(Xs, s,w)dtWs(w) (10.51) 


Esse procedimento rigoroso já é feito para sistemas determinísticos com en- 
tradas limitadas e mensuráveis, pois a solução vai ser da classe das funções ab- 
solutamente contínuas que, como não são diferenciáveis em todos os pontos, não 
podem satisfazer uma equação diferencial ordinária, que define a derivada em 
todos os pontos. Normalmente, na literatura, usa-se a forma abreviada da Equa- 
ção (10.51), que é: 
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dtX,(w) = A(X;, t,w)dtt + B(X,, t, w)dtw;(w) (10.52) 


A segunda integral (da esquerda para a direita) do sistema na Equação (10.51) 
apresenta algumas dificuldades, pois não se trata de uma integral de Stieltjes tra- 
dicional, já que W, não é uma medida fixa em R. Essa segunda integral é conhe- 
cida como integral estocástica e existem vários tipos, sendo as mais conhecidas a 
de Iô e a de Stratonovich. Existem métodos para encontrar soluções explícitas 
de sistemas desse tipo, por meio do chamado cálculo de Iô. Entretanto, esse 
método não será abordado neste trabalho. 

Em alguns casos, o que se busca encontrar não é o processo estocástico propri- 
amente dito, mas as distribuições de probabilidades associadas. Existem métodos 
para se encontrar essas distribuições diretamente, como a chamada equação de 
Fokker-Planck. Seja a equação diferencial estocástica: 

dtX, 


-i = FIM) +N (10.53) 


em que N é o ruido branco (processo estocástico generalizado). Suponha ainda 
que E(W,) = 0 e E(N) =Tó(t—s). É possível mostrar que a equação diferencial 
parcial satisfeita pela distribuição de probabilidades do processo X, é: 


Tor 


OF _ ro F 
2 Ox? 


x = -2 f(x) F] + (10.54) 


em que F = F(x, t) descreve a distribuição de probabilidades ao longo do tempo. 
Esta é conhecida como equação de Fokker-Planck. 

Por se tratar de uma equação diferencial parcial de segunda ordem, é bas- 
tante difícil encontrar uma solução analítica. A Equação (10.53), conhecida 
como equação de Langevin, é de fácil solução usando-se a fórmula de Itô. A equa- 
ção envolvendo integral de Stratonovich é igualmente fácil de se resolver, se for 
realizada a integral de Itô inicialmente. 


10.7.3 Método do polynomial chaos com distribuição normal 


Historicamente, foi Norbert Wiener quem mostrou que se poderia expandir um 
processo estocástico gaussiano com variância finita (ou seja, pertencente ao espaço 
L?(Q, F,P)) em uma série de Fourier-Hermite na variável aleatória, ou seja, os 
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elementos da base são polinômios de Hermite. Cameron e Martin mostraram que 
essa expansão converge no sentido La. 

O espaço de Wiener W(R) é o espaço das funções contínuas C[0, 1] e o espaço 
Co C C[0, 1] é o das funções contínuas que valem zero em zero. Se dotarmos esse 
espaço com uma o-álgebra de cilindros, a medida de Wiener w é a única medida 
de probabilidade em W(R) tal que quando restrita a um subconjunto finito de 
cortes de cada cilindro, por exemplo A),--- , Ay, resulta em: 


P(A: An) = f -f fw (ti, wi) fw (te — ti, wi, wa) (10.55) 
1 N 


fw(ts — te, w2, w3) ++ fw (tn — tn-1: Wn-1, Wn) 
dttw dtwy -- - dtWn 


Desse modo, o espaço de Wiener fica definido como um espaço de probabi- 
lidades (conforme explicado anteriormente) e um ponto qualquer desse espaço é 
uma realização do processo de Wiener. As diversas variáveis aleatórias associadas 
com esse espaço de probabilidades sao definidas como elementos dos espaços de 
Banach Lp(W(R)) e representadas por F(w), em que w € W(R). Para qualquer 


função desse espaço, vale: 


f |F(x)Pdtw < oo (10.56) 
W(R) 


Para o espaço L2(W(R)) com a base ortogonal {œp(t)}, que é um espaço 
de Hilbert, é possível definir um conjunto de variáveis aleatórias ortogonais. A 
expansão em série de Karhunen-Loeve do processo de Wiener é definida, neste 
contexto, a partir das integrais de Stieltjes generalizadas: 


f ” exp(t)dtw(t) (10.57) 


em que w € W(R). Essas integrais são variáveis aleatórias. 
Os polinômios de Hermite (não normalizados), que são obtidos a partir da 
fórmula: 
z P- E e cad PPN? ba 
Nn(x) = (—1)"e qian (e ), para n inteiro positivo (10.58) 


satisfazem a seguinte relação: 
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| CC Nala)No(g)dte = cc pia (10.59) 


~o0 2ºnl/z m=n 
O produto interno no espaço das funções Lə(R) é dado pela integral na Equa- 
ção (10.59), em que a função peso é w(x) = e77", então as funções N,,(x) formam 
uma base ortogonal para este espaço. Alguns exemplos de polinômios de Hermite 


são: 


No(z)=1; Ni(x) = z; No(x) = 2? — 1; N3(r) = 2° — 32 (10.60) 


Dada uma variável aleatória gaussiana A, podemos construir a partir desta o 


conjunto de variáveis aleatórias {N,,(A)} tal que: 


0 mn 


10.61 
2"nl/z m=n 


oO 
E[Nn(A)Nm(A)] = f Nn(A)Nmn(A)em4" dt = l 
—oo 
Portanto, trata-se de uma base ortogonal para L?(Q,F, P). 
É fácil mostrar que E(No(A)) = 1 e E(N,(A)) = 0. Se simplesmente indu- 
zirmos a medida de probabilidade gaussiana no espaço (12, F,P) para o R pela 
variável aleatória A, teremos a função densidade de probabilidade dada por: 


2 


A(x) = e = (10.62) 


e poderemos utilizar todas as formulas anteriores trocando A por x. Neste caso, 
o produto interno fica modificado para: 


Elf(z)g(a)\ = | E f(a)g(a)p(a)dex (10.63) 


e, para formar uma base ortonormal, os polinômios de Hermite precisam ser 


normalizados da seguinte forma: 


Na (z) 
vn! 


Há ainda fórmulas recursivas que podem ser usadas para calcular os diversos 


Ha(x) = 


(10.64) 


polinômios de Hermite normalizados, por exemplo: 
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Vn +1Han(a) — 2Ha(x) + vnHn (x) =0 (10.65) 


Desse modo, qualquer função de variável aleatória (portanto, outra variável ale- 


atória) pode ser escrita como uma expansão em série de Fourier-Hermite: 


f(x) = F. JaHa(x) (10.66) 


n=0 


em que os coeficientes seriam calculados pela fórmula: 


fn = [ $2) Hox) pla)atc = Elf) a(o) (10.67) 


Dada uma função de variável aleatória f(x), tem-se a seguinte relação entre 


sua variância e os coeficientes da expansão em série de Fourier-Hermite: 


Do 


EI (a)] = >, |fnl? (10.68) 


n=0 


Pode-se também definir os polinômios de Hermite de n variáveis. Entretanto, 
é necessário estabelecer algumas notações antes. Um multi-índice é uma n-dupla 
de números inteiros positivos a = (01,02,:-* ,aw) em que os a; pertencem nor- 
malmente a um subconjunto finito dos inteiros positivos, incluindo o zero ou 
não. Isto é, a; pertence ao conjunto (0,1,2,-:- ,m} (com ou sem o zero). Dado 
um muti-índice a = (a@),a2,-:+ ,a@y), define-se o módulo do multi-índice como 
la| = a; +a2+---+ ay. Podemos então utilizar essa notação para os seguintes 
objetos matemáticos: o indice de coeficiente, dado por da = alaiaz, an): OS 
monômios, representados por 1º = xf! x5? ... 24”, em que o grau do monômio é 
dado por |a|; e as derivadas parciais, 0° = 91 /Aaxt" Dag? --- Dra. 


Desse modo, um polinômio de grau M é representado por: 


Pj= E w (10.69) 
jal<N 


Um polinômio de Hermite multivariável de grau |a| pode ser obtido pelo 


produto: 
N 


Hx) = [| Haxo) (10.70) 


i=1 
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Para o caso dos polinômios de duas variáveis até grau 3, tem-se que os possíveis 
multi-índices são (0,0), (1,0), (0,1), (2,0), (0,2), (1,1), (3,0), (2,1), (1,2), (0,3). 
Os correspondentes multi-polinômios de Hermite são apresentados na Tabela 10.1. 


Tabela 10.1: Polinômios de Hermite de duas variáveis até grau 3 


Polinômio de Hermite | Expressão 


H U0 1 

H uy Tı 
HCO T2 
H™: 2 — 1 
HY" 25-1 
HU, Tita 
H3 T — 371 
H\: Lito — T2 
Ht, G52, — Ty 
Hw Ly — 379 


Os polinômios de Hermite multivariáveis também poderiam ter sido obtidos 
a partir da fórmula de Rodrigues: 
1.7 O° Ar 
(o = (DC Coroa a O CM) 
Dados dois multi-índices a, 5 e os correspondentes multipolinômios de Her- 


mite Hº(x) e H? (x), tem-se que: 
1. JS H° (x)H?(x)e?® "dtz = 0 
E Es H®(x)e2" "dtz = 0 


Desse modo, o processo estocástico que é solução do sistema, quando todas 
as variáveis aleatórias x; são normais com média zero e variância 1, além de 
independentes, fica: 


oo 
x(t; Ay, Ag, a eq An) = ag(t)Ho 3 X a(t) H®(A;) (10.72) 
i=1 
n=l n 
+) P agp H NA, Aj) + 


i=l i<j 
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10.7.4 Método do polynomial chaos com outras distribuições 


Quando a distribuição de probabilidades é uniforme, a classe de polinômios orto- 
gonais é diferente. Neste caso, a classe de polinômios ortogonais é a dos polinômios 


de Legendre, que são gerados pela fórmula: 


1 fe 
2”n! dtz” 


Há ainda a possibilidade de calcular esses polinômios por meio de uma. fórmula 


L,(z) = (x? — 1)”, para n inteiro positivo (10.73) 


recursiva: 


= 2n+1 


n 
Lails) = n + 1 Lal) e? ngiti) (10.74) 
Esses polinômios satisfazem a seguinte relação: 
1 0 msn 
[Ln (2)Ln (ade = do MRS (10.75) 
J-i ya m=n 


Se for definido, no espaço das funções Lə(R), o produto interno dado pela 
integral na Equação (10.75), em que a função peso é w(x) = 1, —1 < x < 1, então 
as funções L,(x) formam uma base ortogonal para esse espaço. Alguns exemplos 
de polinômios de Legendre são: Lo(x) = 1, Ly(x) = z, La(s) = 3(322 — 1), 
La(x) = $(5a3 — 3x), La(x) = 3(35a4 — 30a? + 3)). 

Dada uma variável aleatória uniforme A, podemos construir a partir desta o 


conjunto de variáveis aleatórias {L,,(A)} tal que: 


ElLn(A)Lm(A)] = / Ln(A)Ln(A)adtA = : i te (10.76) 
> 2n+1 = 


Portanto, trata-se de uma base ortogonal para Lo(92, F, P). É fácil mostrar que 
E(Lo(A)) = 1 e E(L,(A)) = 0. Existe também uma fórmula recursiva para 


calcular os diversos polinômios de Legendre: 


2+1 i 
TA as sans 
ho) — T 


Para o caso de outras medidas de probabilidade, a expansão em polinômios 


Liy (£) = 


feala) (10.77) 


de Hermite não tem garantida a convergência mais rápida, e outros tipos de ba- 
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ses polinomiais deveriam ser escolhidas para recuperar esta convergência rápida. 
Dependendo da função medida de probabilidade, a base de polinômios deveria 
ser escolhida a partir da relação (conhecida como esquema de Wiener-Askey) 


mostrada na Tabela 10.2. 


Tabela 10.2: Esquema de Wiener-Askey. 


Distribuição de probabilidade | Tipo de polinômio 


Gaussiana polinômios de Hermite 
Gama polinômios de Laguerre 
Beta polinômios de Jacobi 
Poisson polinômios de Charlier 
Binomial negativa polinômios de Meixner 
Hipergeométrica polinômios de Hahn 
Uniforme polinômios de Legendre 


10.7.5 Utilização em análise de robustez 


Para a análise de robustez de sistemas dinâmicos (lineares e não lineares) com 
parâmetros incertos (tratados como aleatórios), tanto esses parâmetros como os 
estados e as saídas do sistema precisam ser expandidos na base de polinômios 
aleatórios, uma vez que são variáveis aleatórias e processos estocásticos. Desse 


modo, dado um sistema dinâmico autônomo da forma: 
x = F(x) (10.78) 


os estados (componentes do vetor de estados x) são expressos na forma z;(t, A) = 
p pS Lim (t)Om(A), em que p é o número de polinômios na expansão truncada. 
A seguir, mostramos as duas maneiras de calcular os coeficientes temporais dessa 


expansão. 


Método intrusivo 


O método intrusivo consiste em substituir a solução candidata na Equação 10.78. 
A derivada temporal dos estados, ou seja, t;, somente afetaria a parte não ale- 
atória, ou seja: Z;(t, A) = ss Zim(t)dm(A). Após a substituição na equação 
de estados, e utilizando as propriedades de ortogonalidade, chega-se a um con- 
junto de sistemas determinísticos que, quando integrados, fornecem amostras de 
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soluções (realizações dos processos estocásticos de estado e saída). Boas referên- 
cias para o método intrusivo são propostos nos trabalhos de Colón et al. (2017), 
Smith, Monti e Ponci (2006), Xiu e Karniadakis (2002) e Fisher e Bhattacharya 
(2008). 

Como exemplo, o caso do sistema dinâmico não linear t = ax?, após as 
expansões e as substituições na equação, tem-se: 


= 


p-l 
> 4m(t)m(A) = > Ambm WE esa) o t)ġ;(A) (10.79) 


m=0 m=0 


Aplicando-se a projeção, em ambos os lados, na direção de @,(A): 


p-1 p-1 p-1lp-1 
Er(dr Or) = 4% Embm, Or) — + > X amir; (bmbid;, Or) (10.80) 
m=0 m=0 i=0 j=0 
ae a (mij, Or) 
=D 2o toto (10.81) 
m=0 i=0 j=0 (dr, or) 


ou seja, onde antes havia uma equação, agora há p, uma para cada polinômio 
da expansão truncada. Da mesma forma, o número de parcelas do lado direito 
passa a ser p? (na verdade, é um número menor, já que o multi-índice Emijr = 
eae possui várias simetrias). Para avaliar o sistema estocástico, faria-se 
então a integração deste sistema determinístico, que é acoplado. 


Cabem aqui algumas observações: 


1. O resultado é um conjunto de equações determinísticas, que podem ser 
resolvidas pelos métodos numéricos tradicionais. 


2. O método somente pode ser aplicado para sistemas não lineares do tipo 
polinomial. Para casos em que aparecem funções transcendentais, estas 
devem ser expressas na sua série de Taylor, a qual deve ser truncada, de 


modo a se ter um sistema polinomial aproximado. 


3. O número de parcelas nas equações expandidas pode crescer muito rápido 


com o número de polinômios. 


4. O método pode ser estendido para diferentes variáveis aleatórias. 
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5. O método pode ser generalizado para equações diferenciais parciais esto- 


cásticas. 


Para o caso de sistemas dinâmicos em MF (ou seja, sistemas de controle), a 
entrada do sistema também vai depender das variáveis aleatórias, uma vez que 
diferentes realizações da saída da planta correspondem a diferentes atuações do 
controlador (este, em geral, não possui parâmetros aleatórios — como quando é 


implementado em um computador, para operar em tempo real). 


Método não intrusivo 


Dado que a solução aproximada (truncada) que se busca é da forma: 


—1 
ai(t, A) = e Lim(t)dm(A) (10.82) 


m=0 
para cada estado, os coeficientes x; m(t) poderiam ser calculados para algumas 
amostras temporais (ty. + pela fórmula: 


Elóm(A) i(A)| 


em que o denominador, que envolve uma integral, pode ser calculado por uma fór- 


tim(tk) = (10.83) 


mula explícita (geralmente usando-se as fórmulas recursivas que geram os polinô- 
mios da base) e o numerador, que também é uma integral, precisa ser calculado 
numericamente por técnicas de quadratura. 

Supondo que são n parâmetros independentes para o instante t, deve-se gerar 
uma grade de pontos no espaço R” com coordenadas (A1, Ao,--- , An), calcular a 
função rift, A) em cada ponto por simulação do sistema dinâmico com os valores 
dos À correspondentes fixados e, então, resolver a integral do numerador. Se a 
distribuição de pontos da grade em R” for uniforme (por exemplo, no hipercubo 
(0, 1]” cada dimensão tem m pontos), o número de simulações é m”, o que fica 
muito custoso computacionalmente (maldição da dimensionalidade). Neste caso, 
pode-se usar o método de integração por sparse grids, que consiste em selecionar 
em R” (espaço dos parâmetros) uma matriz cujo número de pontos cresce muito 


mais lentamente com n que o da matriz uniforme. 


Capitulo 11 


Métodos de otimização 


11.1 Introdução 


O processo de otimização consiste na utilização de algum algoritmo matemático 
para minimizar ou maximizar alguma propriedade do sistema desejado. Para isso, 
é necessário analisar e construir uma função custo-benefício (Je) que relaciona as 
características do sistema e o custo associado à mudança das variáveis descri- 
tas pelo modelo matemático. Por exemplo, a qualidade de renderização de uma 
animação é diretamente relacionada à quantidade de processamento e armaze- 
namento computacional disponível. Com recursos infinitos é possível aprimorar 
sem fim a animação, entretanto, existe uma saturação e/ou um limite para a 
quantidade de pixels que a íris consegue capturar. Ou seja, o uso de uma reso- 
lução maior (custo maior) não acarretará em uma qualidade melhor (benefício 
maior). Entretanto, com recursos finitos existe um custo associado ao processo 
e ao armazenamento de cada quadro dessa animação, consequentemente, o custo 
computacional e econômico para chegar à qualidade máxima da imagem aumenta 


consideravelmente. 


11.2 Função de otimização 


Podemos definir uma função custo genérica (Je) de duas variáveis (B1, B2) que 
será otimizada (maximizada ou minimizada) dependendo do problema a ser es- 
tudado: 


219 
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= as a4By 
Je( By, Bo) = m Bı + a2 + By T B, 


em que Je é a função custo-benefício a ser minimizada, a, são constantes e By, Bo 


+ asB2B; (11.1) 


são os valores da variáveis, nos casos de a3,a4 temos Bı < 0. Quando há diversas 
variáveis, é necessário avaliar também a interferência entre elas (a4,a5). De 
uma forma geral, podemos dizer que a, expressa uma relação linear com Bi, 
assim, o aumento de Bı proporciona um aumento no custo; az representa um 
custo inerente ao sistema; ag expressa uma relação inversamente proporcional ao 
aumento de By; as constantes a4 e as expressam a interação entre as variáveis 
independentes do sistema. É importante salientar que a função da Equação (11.1) 
é apenas um exemplo, e que funções de custo-benefício podem ou não ter todos 
os termos apresentados. 

Há inúmeros métodos de otimização da Equação (11.1), no entanto, neste livro 
exploraremos o Particle Swarm Optimization (PSO), que possibilita encontrar a 


melhor solução possível para sistemas complexos. 


11.3 Particle Swarm Optimization (PSO) 


O PSO ou método de enxame de partículas é um método de otimização em que 
um processo estocástico usa uma número de pontos para imitar o comportamento 
de enxames de animais (possíveis soluções). Para isso, a população inicial deve 
ser aleatória e espaçada entre os limites da otimização, pois por mais que tenha- 
mos uma ideia de como será o comportamento da função de otimização, há uma 
possibilidade de o método não convergir para o máximo global e, assim, encon- 
trarmos uma solução parecida com o máximo (máximo local). Isso impossibilita 
a análise, pois não é o ponto de otimização desejado. 

A Figura 11.1 mostra o processo de convergência dos pontos do PSO. A Figura 
11.1A ilustra que a população inicial de pontos é distribuída aleatoriamente, o 
x em vermelho é o ótimo global para as restrições impostas ao problema. Na 
primeira interação, Figura 11.1B, todas as partículas ganham uma velocidade, 
com base nas restrições do problema e na melhor posição da comunidade. Em 
vermelho, a melhor posição para aquela partícula também é a posição global 
(como esta é a primeira interação, as partículas não possuem nenhuma velocidade 
inicial e todas as partículas tendem grosseiramente para a posição em vermelho). 
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Na Figura 11.1€, podemos ver que todas as partículas possuem uma velocidade, 
pois cada partícula em vermelho deixou de ser a melhor posição global para a 
partícula em azul. Esse comportamento pode ser explicado pela equação a seguir, 


que relaciona os parâmetros das partículas. 


Para determinar as posições das n partículas para o processo de otimização 
do PSO, é utilizada a Equação (11.2): 


Vi = CoV} ' + C1 Ri (Xw — Xp) + C2R2(Xpb — Xp) (11.2) 


em que Vp é a velocidade da partícula para a próxima interação, Co é a inércia 
aplicada às partículas, C4 é o parâmetro de confiança para o melhor já visitado 
por essa partícula, C2 é o parâmetro de confiança para o melhor já visitado por 
todas as partículas, Rj e Rə são fatores aleatórios adicionais para melhorar a 
procura, X; é a melhor posição conhecida pela partícula, Xp é a melhor posição 


da comunidade e X, é a atual posição da partícula. 


Recomenda-se o uso de parâmetros adequados para diferentes tipos de pro- 
blemas. Co devem ser adequados e podem ser dinâmicos para evitar velocidades 
altas nas interações iniciais e baixas velocidades nas interações finais. Os parâ- 
metros C1, C2 indicam o grau de confiança nas informações de cada partícula e o 
grau de confiança na comunidade, respectivamente; altos valores de C4 levam ao 
mínimo local, enquanto valores de C2 altos levam a ignorar informações de cada 
partícula. Rj e Re são valores aleatórios diferentes a cada interação, utilizados 


para redirecionar as partículas e melhorar a busca. 


c) 


Figura 11.1: Mecanismo de otimização de enxame de partículas. 
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11.4 Algoritmo genético 


O algoritmo genético é um método de otimização baseado na evolução das espé- 
cies de Darwin, ou seja, as características mais desejadas que contribuem para a 
dominação da espécie são destacadas e crescem a cada interação. De forma aná- 
loga, o algoritmo genético baseia-se em uma população inicial com características 
aleatórias e, a cada interação, a geração de indivíduos mais aptos sobrevive (fs), 
ocorrendo a recombinação dos genes ( f,) e a mutação (fm). O grau de adaptação 
é baseado na função de otimização: quanto mais próximo do objetivo, mínimo 
(zero) ou máximo (infinito), mais adaptado a este meio esse grupo de genes se 


encontra. Esse mecanismo é exemplificado na Figura 11.2. 


Al 
x| 
H A B 


Figura 11.2: Mecanismo de otimização por algoritmo genético. 


Na Figura 11.2A, ocorre a mutação do parâmetro X para Y. Essa mutação 
depende do tipo de parâmetro, que pode ser inteiro ou decimal, e está sujeita às 
restrições impostas ao problema. Com isso, os novos indivíduos são avaliados e 
essas três operações são repetidas a cada interação para avaliar e convergir para 
o valor desejado. Os parâmetros fs, fr, fm são os que influenciam a forma de 
procurar pelo mínimo global. Recomenda-se f, > 0,05 para não ser tendencioso 
a mínimos locais e fm < 0,05 para que a busca não se torne aleatória, f, é o 
valor de 1 — fs — fm- 


11.4.1 População inicial 


O valor da população inicial adotado é geralmente 100n,, em que na é o numero 
de variáveis a serem otimizadas. Entretanto, valores maiores que esse tendem a 
diminuir a velocidade entre as interações e valores menores que esse tendem a 
acelerar o processo de otimização, podendo haver regiões sem amostras. Popu- 
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lações muito reduzidas tendem a ser muito rápidas para cada interação, contudo 
um número pequeno pode dificultar o processo por não ter indivíduos suficientes 


para varrer as variáveis. 


11.4.2 Critérios de parada 


Os critérios de parada são parâmetros adotados para que a otimização termine, 
tanto para PSO quanto algoritmo genético, a saber: número de interações (Nj), 
avanço mínimo por interação (A,m) e número máximo de interações sem avanço 
(S,). Ni é o numero maximo de repetições do algoritmo, após este valor o me- 
lhor resultado é considerado como mais apto ou melhor. Am é o valor entre as 
interações n e n — 1 para que n não seja considerada uma interação sem avanço, 
ou seja, uma interação que possui pouca ou nenhuma melhora em seu valor em 
relação à interação passada; esse critério indica que o objetivo já foi alcançado ou 
não há um ganho significativo entre as modificações. S, é o número de interações 
de 


A combinação de S, e Am geralmente pára a otimização, pois, na busca do 


consecutivas em que a expressão |J, | < Am é verdadeira. 


(n) — “C(n—1) 
objetivo, se Am for baixo e S, for alto, o algoritmo não tem melhoras significativas 
e pára por N;. O mesmo é válido para valores altos de Am e baixos de Sy, em 
que somente ganhos significativos são considerados, logo, o sistema para pois não 


houve avanços significativos. 


11.4.3 Restrições de variáveis 


As variáveis a serem otimizadas devem ser limitadas de acordo com o problema 
imposto. Os tipos de limitações estão geralmente relacionados à formulação da 
função custo-benefício, para que as variáveis não assumam valores negativos ou 
diferentes de zero. Outras restrições impostas, como físicas ou comerciais, são 
do tipo incrementos inteiros ou valores não negativos. Por exemplo, número de 
trabalhadores, número de assentos disponíveis numa frota de veículos, tempera- 
tura de conforto. Outro tipo de restrição aplicada é a descontínua. Esse tipo de 
restrição muda de forma abrupta o comportamento da função J,. Por exemplo, 
um desconto aplicado após um certo valor vendido, um aumento significativo no 
custo energético apos uma determinada temperatura. 
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Exemplo 


Um exemplo de aplicação de otimizadores é o modelo de quarto de carro ( quarter- 


car) que a representação do problema está na Figura 11.3. 


Xr 


Figura 11.3: Exemplo de quarter-car. 


Com isso, as equações diferenciais são definidas como: 


mato = +kı (z1 — x2) + cı (t1 — t2) — ko(x2 — Tr) dr 
mit, = —kı (zı — 72) — cı (t1 — t2) 


em que: 


Ly = Ampsin(2z ft) (11.4) 


O integrador será ode45, com um tempo de 25 s, e os parâmetros utilizados 
nessa simulação serão os da Tabela 11.1. 


Tabela 11.1: Parâmetros da simulação 


Fira Variável 
kv Nm 


2 x 101 


Variável 
ma [kg] 


Valor adm. 
2 x 10! 
2.5x 109 
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Variando os parâmetros kı e k2 em relação ao seu valor absoluto, entre 0 e 2, é 
possível extrair o máximo dos últimos 10 s de simulação e construir o gráfico de 


máximos, com 200 pontos em cada direção para mostrar o plano de otimização. 


Como pode ser visto na Figura 11.4, o máximo ocorre em uma região de kı e kg 
próximo a 2. Com isso, é possível montar uma função custo para averiguar onde 
o modelo matemático do quarter-car possui um maior deslocamento máximo, de 


acordo com a seguinte função: 


1 rp 
id marij’ S€ |maz(xı)| #0 (11.5) 
101°, se |maa(a1)| = 0 


Caso a otimização esperada seja de várias unidades no valor de F}, os valores 
de Sọ 1 Am 4 poderiam ser usados, pois uma variação pequena nas variáveis 
causaria uma mudança significativa. Entretanto, Sọ | Am tT é recomendando 


para evitar paradas da otimização sem chegar no resultado desejado. 


015-5 


Maz(z,) 


0.054 


Figura 11.4: Máximas amplitudes para a variação de kı e cı, em que a escala de cores 
representa a máxima amplitude. 


Essa função é utilizada caso haja algum valor de |maz(x1)| = 0, o que ocorre 
pois a região dos limites está entre 0 e 2. Recomenda-se utilizar a minimização 
da função objetivo para maximar o deslocamento com as restrições de 0 < ky < 2 
e 0 < kg < 2, a função de custo-benefício da Equação (11.5) e uma população de 
200. 
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| Varredura | PSO | Algoritmo genético 
kh | 2 |2| 2 
eleil a 

Interações 79 

|max(zxı)| 0,1499 


Capitulo 12 


Sistemas mecatrônicos nao 


lineares 


12.1 Introdução 


Para que seja possível analisar o comportamento dinâmico de sistemas meca- 
trônicos sem que haja necessidade de montagem de protótipos de alto custo, 
modelos matemáticos para os vários componentes do sistema a ser analisado são 
desenvolvidos. Comumente, para simplificação da manipulação matemática, os 
modelos são linearizados. Em muitos casos, os modelos lineares se aproximam 
muito do comportamento real do sistema modelado, mas apenas dentro de um 
range definido para as variáveis do sistema. Quando o range dessas variáveis 
aumenta, efeitos não lineares podem se tornar dominantes e o modelo linear não 
atende mais às necessidades das análises. Para analisar tais efeitos, um modelo 
não linear se mostra necessário. 

Os sistemas lineares se caracterizam por satisfazer o princípio da superpo- 
sição, segundo o qual a resposta produzida por duas funções diversas aplicadas 
simultaneamente a um dado sistema é a soma das duas respostas individuais. Em 
outras palavras, podemos dizer que um sistema é linear quando causa e efeito fo- 
rem proporcionais. 

Já os sistemas não lineares são aqueles aos quais o princípio da superposi- 
ção não se aplica. A não linearidade estática é a forma mais simples de não 
linearidade, como pode ser visto na Equação (12.1). 
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y(t) = ax(t) + bz? (t) (12.1) 


em que a saída é a soma de dois termos, um linear e outro não linear, sendo esta 
uma não linearidade cúbica 

Na prática, a maior parte dos componentes de um sistema mecatrônico apre- 
senta comportamento não linear. Essas não linearidades surgem, por exemplo, 
em virtude de efeitos como saturação e fricção, sendo que estes não podem ser 
negligenciados como normalmente são na teoria linear. Se não considerarmos o 
efeito de saturação do campo num modelo linear clássico, como o de um motor 
de corrente contínua, este pode atingir velocidade infinita, e se desconsiderarmos 
a zona morta, este sai da inércia com uma corrente quase nula. Portanto, quando 
os componentes são colocados para trabalhar dentro destas regiões, o projeto de 
controladores lineares normalmente já não tem mais a mesma performance. 

Contudo, é um exagero dizer que a teoria de controle de sistemas lineares não é 
aplicável a problemas práticos de engenharia pelo fato de serem quase sempre não 
lineares; é importante lembrar que ela não pode simplesmente ser negligenciada. 

As não linearidades podem ser classificadas em estáticas e dinâmicas. Sis- 
temas onde há uma relação não linear entre a entrada e a saída, sem envolver 
uma equação diferencial, são chamados não linearidade estática. Já quando essa 
relação ocorre por meio de uma equação diferencial não linear, ela é classificada 
como uma não linearidade dinâmica. 

Neste capítulo serão descritas as não linearidades mais comuns que afetam 
tanto sistemas mecânicos quanto eletrônicos, como zona morta, saturação, histe- 


rese, entre outras. 


12.2 Saturação 


A saturação é uma não linearidade muito comum e importante na modelagem 
de sistemas mecatrônicos, mas muitas vezes negligenciada. A saturação limita o 
range de trabalho do sistema modelado, ou seja, ela limita a saída a um valor 
maximo, mesmo que a entrada continue aumentando, como pode ser visto na 
Figura 12.1. 

Um exemplo típico da saturação pode ser encontrado na curva de magneti- 
zação de um motor de corrente contínua (CC), em que o campo atinge um valor 
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Saida 


Figura 12.1: Gráfico de saturação. 


máximo não importando se a corrente aplicada aumente mais. A inclusão da 
saturação no modelo matemático de um motor CC garante que este tenha velo- 
cidade e torque finitos. A saturação também é muito comum em amplificadores 
operacionais, sendo que a saída é proporcional à entrada apenas para um range 
limitado de valores da entrada; para valores fora desse range a saída passa a ser 
não linear. 

Podemos escrever a saturação no modelo matemático do motor CC da seguinte 


forma: 


z(t) = Dt ago [Do - 1 son = Og sgm(ult)) (12.2) 


em que u(t) é o sinal de entrada, a é o valor da amplitude de saturação e s(t) 
representa a saída. 

A Equação (12.2) pode ser representada graficamente em relação ao tempo 
conforme visto na Figura 12.2. 


12.3 Zona morta 


A zona morta é outra não linearidade que muitas vezes é negligenciada na mo- 
delagem de sistemas mecatrônicos, mas que tem um grande impacto no controle 
do sistema. A zona morta se refere à região onde a saída vai para zero quando 
um valor limite é atingido, conforme pode ser visto na Figura 12.3. 
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Figura 12.2: Gráfico de Saturação em relação ao tempo 


Saida 


Zona Morta 


/ 


Figura 12.3: Gráfico de zona morta. 


A zona morta é comumente encontrada em sistemas como motores CC, vál- 
vulas proporcionais pneumáticas, entre outros. No motor CC, isso se deve ao 
fato de o campo assumir um comportamento não linear nas tensões próximas a 
zero, tornando-se muito fraco para mover o rotor. Essa não linearidade pode ser 
modelada da seguinte forma: 


1 + sgn(v — ju(t)|) 


5 [u(t) —w.sgn(u(t))] (12.3) 


a(t) = u(t) — v.sgn(u(t)) — 


em que u(t) é o sinal de entrada, v é o valor que representa o limite da zona 
morta e z(t) representa a saída. 

A Equação (12.3) pode ser representada graficamente em relação ao tempo, 
conforme visto na Figura 12.4. 
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Figura 12.4: Gráfico de zona morta em relação ao tempo. 


12.4 Backlash 


Outra não linearidade importante que ocorre comumente nos sistemas mecatrô- 
nicos é a histerese nas caixas de redução ou transmissão mecânicas. Comumente, 
essa não linearidade é chamada de folga e representa o espaço entre os dentes 
da engrenagem motriz e da engrenagem acionada. Essa folga é necessária para 
lubrificação e para compensar a dilatação térmica e os desvios de fabricação. A 
Figura 12.5 apresenta um gráfico dessa não linearidade. 


Figura 12.5: Gráfico de backlash. 


O backlash pode ser descrito pela seguinte equação: 
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Ne; 


Folga 


Figura 12.6: Imagem do acoplamento entre engrenagens. 


r(t-1) se |u(t)—a(t-1)| < £ 


a(t) = ¢u(t)— E£ se |u(t)—a(t—1)|> 4 e u(t) >-a(t-1) 


u(t) + {orga se |u(t)—a(t—1)|> foiga e u(t) < —z(t-1) 
(12.4) 


em que u(t) é o sinal de entrada, folga é o valor que representa o valor da folga 


e x(t) representa a saida. 


O gráfico do backlash pode ser entendido considerando-se o acoplamento entre 
a engrenagem motriz e sua respectiva folga entre os dentes, conforme visto na 
Figura 12.4. Se considerarmos que a engrenagem motriz (EM) está girando no 
sentido horário, e a engrenagem acionada (EA), consequentemente, no sentido 
anti-horário, sendo que EM está encostando em EA1, o seu movimento é repre- 
sentado pelo segmento de reta DA na Figura 12.4. Quando invertemos o sentido 
de giro da EM, e considerando que a carga é controlada por atrito com inércia 
insignificante, a EA para de girar até que os dentes da EM se desloquem na dis- 
tância da folga e encostem em EM2, o que é representado pelo segmento AB na 
Figura 12.4. Após isso, a EA volta a girar, mas agora no sentido horário, o que é 
representado pelo segmento BC, até que uma nova reversão ocorra, representada 
pelo segmento CD. 


A mesma sequência pode ser vista no gráfico tempo x rotação para a engre- 
nagem motriz (entrada) e a engrenagem acionada (saída), apresentado na Figura 
12.5. 
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Figura 12.7: Gráfico de tempo x deslocamento para um sistema com backlash. 


12.5 Fricção 


Qualquer coisa que se oponha ao movimento relativo do corpo é chamada de 
atrito. É um tipo de não linearidade presente no sistema. O exemplo comum é o 
motor elétrico, em que encontramos o atrito devido ao contato entre as escovas e 
o comutador. 

O atrito pode ser dividido nos dois tipos descritos a seguir: 


e atrito estático: em palavras simples, o atrito estático age no corpo quando 
este está em repouso; 


e atrito dinâmico: atua no corpo quando há um movimento relativo entre 
a superfície e o corpo. O atrito dinâmico pode ser dividido em: atrito 
deslizante, que age quando dois corpos deslizam um sobre o outro, e atrito 


por rolamento, que age quando os corpos rolam sobre outro corpo. 


12.5.1 Atrito de Coulumb 


A ideia básica do atrito de Coulumb é que se oponha ao movimento e que sua 
magnitude seja independente da velocidade e da área de contato, com a força de 


atrito Fo proporcional à força normal, como apresentado na Equação (12.5): 


Fo = p+ Fy, (12.5) 


em que Fo é força de atrito de Coulumb, ju é o coeficiente de atrito, e Fn é a 
força normal ao movimento. 
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12.5.2 Atrito viscoso 


O termo atrito viscoso é usado para descrever a força de atrito causada pela 


viscosidade de fluidos, sendo normalmente descrito como: 


F=F,+v (12.6) 


em que F, é uma constante que depende da natureza do fluido e da área do objeto 


e v é a velocidade do objeto no fluido. 


12.5.3 Atrito de Stribeck 


Os componentes de atrito clássicos podem ser combinados de diferentes maneiras. 
Esses modelos têm componentes que são lineares em velocidade ou constantes. 
Stribeck observou que a força de atrito não diminui descontinuamente, mas que 
a dependência da velocidade é contínua. Isso é chamado de atrito de Stribeck. 


Uma descrição mais geral do atrito é dada por: 


F(v) se uv#Ło0 
ps Fe se v=0 e|Fe|<Fs (12.7) 
Fgsgn(F.) outros 


sendo F, uma função descrita por: 


F(v) = Fo + (Fs — Fo)e est" + Fy, *v (12.8) 


em que Fc é o atrito de Coulumb, F, + v é o atrito viscoso, Fe representa a força 


externa, e Fg é o atrito estático. 


12.6 Relé 


Relés eletromecânicos são frequentemente usados em sistemas de controle cuja 
estratégia requer um sinal de controle com apenas dois estados, sendo eles ligado 
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e desligado. Esse tipo de sistema também é chamado de controlador on-off. A 


Figura 12.8 representa o sinal de um relé ideal. 


Saída 


Entrada 


Figura 12.8: Gráfico de tempo x deslocamento para um sistema com backlash. 


A saída não linear do relé alterna entre dois valores especificados. Quando 
o relé está ligado, ele permanece ligado até a entrada cair abaixo do valor do 
parâmetro do ponto de desligamento. Quando o relé está desligado, permanece 
desligado até a entrada exceder o valor do parâmetro de acionamento. 

Conforme já mencionado, as não linearidades estão presentes em pratica- 
mente todos os sistemas, sendo que o sinal de relé não está fora deste conceito. 
Considerando que o chaveamento de um relé depende do campo magnético e do 
deslocamento da chave, podemos considerar que ele está sujeito a histerese e zona 
morta, como pode ser visto nas Figuras 12.9, 12.10, 12.11 e 12.12. 


Entrada 


Figura 12.9: Gráfico de tempo x deslocamento para um sistema com backlash. 
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M1 se (u(t)>h1) ou [(h2<u(t)<hl) e (u(t-1)=M1)) 
tt) = 
M2 se (u(t)<h2) ou [(h2<u(t)<hl) e (u(t—1)=M2)] 
(12.9) 


Figura 12.10: Gráfico de tempo x deslocamento para um sistema relé com histerese. 


Saida 


Figura 12.11: Gráfico de tempo x deslocamento para um sistema com backlash. 


een = 


es 


E 


i i E) ; , , E 
— 


Figura 12.12: Grafico de tempo x deslocamento para um sistema com backlash. 
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is sgn(u(t) — a) E sgn(u(t) + a) 


Não linearidade do relé (a) ligado/desligado; (b) ligado/desligado com histe- 


rese; (c) ligado /desligado com zona morta. À Figura (a) mostra as características 


(12.10) 


ideais de um relé bidirecional. Na prática, o relé não responderá instantanea- 
mente. Para correntes de entrada, entre os dois instantes de chaveamento, o relé 
pode estar em uma posição ou outra, dependendo do histórico anterior da en- 
trada. Essa característica é chamada de on-off com histerese, mostrada na Figura 
(b). Um relé também possui uma quantidade definida de zona morta na prática, 
que é mostrada na Figura (c). A zona morta é causada pelo fato de o enrola- 
mento do campo de relé exigir uma quantidade finita de corrente para mover a 
armadura. 
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